中国IDC圈4月8日报道,从庞杂的数据背后挖掘、分析用户的行为习惯和喜好,找出更符合用户「口味」的产品和服务,并结合用户需求有针对性地调整和优化自身,就是大数据的价值。
元数据(Metadata)的概念
简单说,元数据是对数据本身进行描述的数据,它不是对象本身,它只描述对象的属性。
比如,一幅画本身,是数据。而这幅画的作者、完成时间、尺寸、价格、类型等等,就是它的元数据。元数据的价值,第一是能够从侧面描述对象;第二点就是可以结构化、信息化。
什么意思呢?
比如,我们要判断一幅画的价值,除了专家直接通过画的艺术性来评价,还可以通过元数据来判断。这幅画是名家的还是二流画家的?这幅画是作者在他创作鼎盛时期的作品,还是在年轻时的作品?这幅画是作者擅长的类型还是他不熟悉的?用这些描述的信息,我们就能把这幅画的价值算得八九不离十。虽然肯定会存在误差,但同样是科学合理的方法。
那用元数据而非数据本身描述对象的意义何在?
这就是在大数据上产生的价值了:对于非结构化的、非量化的对象本身,结构化的元数据可以用以快速计算和判断。
1.大数据应用的第一阶段:辅助产品
最初的应用比较简单,就是用以辅助产品人员和市场人员做判断。
过去的实体产品做一次调研很麻烦。比如饮料公司,调研人员要用各种方式观看他们喝饮料的场景和步骤。问卷是最常见的,但不够准确。所以会组织各种各样专业的现场试验,要搭建环境(一般是有单面玻璃或摄像头的)、邀请志愿者,然后引导他们按照日常的习惯去完成一些操作。
显然这种办法非常笨重。
而现在的互联网产品则根本无须这么麻烦。用户所有的使用数据、行为,都是记录在案的,想知道什么,瞬间就能分析出来。过去想知道用户有没有做一件事,有没有用过这个功能,实在太难了。
现在呢,想知道点击这个行为点击了几下、点击在哪里、什么时候点的、甚至这是在什么地方点的,都一清二楚。平时用户用不用这个功能、怎么用这个功能,也就一目了然。
对于产品设计者来说,这是至关重要的数据。而且,这是完整的数据!如果是互联网产品,那么我知道的是所有用户的数据,不是过去传统行业产品的样本数据。
腾讯知道所有微信用户有多少用朋友圈、知道这些用户每天都发几条朋友圈、知道这些用户每天都发了什么。每一个数据都是真实可用的。
(过去发行量再大的报纸也很难知道读者性别,然而现在再小的微信公众号也可以实时获取)
在实体产品的行业,随着未来整个产品从生产-销售-使用的信息化,大数据也会渐渐起到更大的作用。过去我卖的一瓶水,可能到某个超市就断掉了,我不知道这瓶水被谁买走了。
但现在我在天猫卖的一瓶水,我知道对方这个用户是每个月买十箱水的,他的地址是某个高档餐厅,那我就知道这瓶水的目标受众是谁了。
这是元数据的价值所在。
所以,大数据的第一阶段是:辅助产品设计者做判断、让产品制造者更好地满足用户。
这时候的大数据主要是来为产品提供支持,产品再应用于用户。
2.大数据应用的第二阶段:创造价值
在数据的数量和质量达到一定程度后,事情开始变化了。元数据将不仅作为产品的辅助,而是变成了最有价值的产品本身。
很简单的,全中国最熟悉老百姓消费习惯的是工商局吗?是哪个协会吗?是哪个科研机构吗?都不是,是淘宝。
拥有最全面的个人信用信息的,是人事局吗?是银行吗?是咨询公司吗?都不是,是支付宝。
道理其实很简单,所有行为(消费、交易)发生在了这个平台上,而这个平台又有所有数据的记录,那这些数据就能产生巨大的价值。
你以为做医疗健康这方面的产品仅仅是关注你的健康吗?并不是,他们同时还能够记录你所有的体征,这是第一线的临床数据。