在如今的数据世界当中,我们已经被淹没在数据的汪洋中。我们周围充斥着大量的数据信息资源,它们每一天都在萦绕在我们周围。它们以不同的形式充斥着我们生活中的每一个角落,时时刻刻。数据的3V(Volume=体量;Velocity=速度;Variety=多样性)特性被巧妙地比喻成企业在力争从自己的数据信息中获取价值时所面对的三座大山。每一座大山都将会因为科技领域内的突破而土崩瓦解(也可以说是被降低)。伴随着并行处理能力的诞生,通过机器学习和深度学习算法以及编辑运算技术,这三座大山在人类面前真的只是是小巫见大巫。
你的数据有何含义?
数据,不是简单的一连串数字。它们自身确实拥有奥秘。它们也许代表了某些有趣味性的事情;它们也可以表示对你的企业有至关作用的结果,它们也代表着可以对你企业的重要事件有某种预测能力。数字,可以反映出企业的销售绩效,也可以代表客户的满意度,它们甚至可以反映医疗保健服务的质量水平。因此,确保企业的数据具有一定的含义有时候要比挖掘其中的价值显得更加至关重要。
数字的含义和你企业数据的真实性息息相关。每当我们使用公制单位进行测量时,我们总是需要问“测量得到的数据含义是什么?”举个例子,我们可以通过不同的方式一点点达到“消费者满意”的目标。客户的满意度可以从以下几个方面得到参考:消费者调查报告、微博反馈,或者可以从呼叫中心的通话当中得到窥探。这几种客户满意度的考评方式之间有天壤之别。消费者的满意度调查评分主要是针对整体的满意度进行设计的一种衡量方式,然而微博、微信等社交网络当中的数据,我们对它的可控性微乎其微,而且其中所反映出的消费者满意度也只是处于短时间的层面。然而,这些衡量的方式都被涵盖在“消费者满意度”范围内,它们拥有不同的含义。
学科知识专家
仅仅使用技术的话,其实无法将真真切切的难题迎刃而解。因此,这就是学科知识专家可以一展身手的地方了,专业知识可以帮助你理解数据当中的含义。因为你需要学科专家对你的衡量方式进行评估。这些专家利用自己在某一领域当中深厚的知识功底,可以观察到不同数据资源和各种类型衡量指标之间的细微差别,而且这些专家也可以知道解决这样一个难题所需要的知识应该如何运用。难怪学科知识专家是构成一名合格数据科学家的三大技能支柱之一。
请一定不要忘记,数字并非表面看起来那般简单:它代表了你的公司的某些利益。一定要弄清楚企业的度量标准,并且弄清楚这些度量标准对你的企业意味着什么。如果你想了解为什么你的数据的真实性有如此重要的作用,那么在一开始的时候你必须相信数字当中隐含的潜台词。
编译丨化学数据联盟-丑灿
注:本文系化学数据联盟授权数据观发布,转载请注明来源。