最后就是数据的可视化,如何能够实现直观的用户可以理解的结果,这是由于数据产生的方式,数据本身形态的变化,使得大数据技术不断进展。从技术本身来看,我们认为大数据技术的发展和创新,呈现这样三个阶梯的状态,从原创技术到开源社区,到最后的产品。其实,对应到我们产业界,对应着不同的企业群体,跟大家现在所看到的,这个数据分析的基础是Google04年通过几篇论文提出来的。实际上,Google在2000年之前已经拥有这些技术,三四年之后他通过学术论文的方式把这种技术和思想公开出来,当然由这个技术公开之后形成开源社区的版本,可能又过了3-4年的时间。所以说,从原创到最后的开源,中间会有5-6年的时间差。
目前大多数的企业,是沿着开源的方向走,在开源里汲取营养。但还有其它一些公司,他希望把开源社区的版本变成商品,变成一种可以实现企业级应用的产品,这在开源领域又之后3-4年。其实,也就是从互联网领先的企业到互联网的领域,到社会的其它领域,其实呈现出了这三个不同的发展阶段。
刚才一直提到互联网,实际上互联网行业确实是目前大数据应用的领跑者,因为从最初互联网应对自身的数据分析处理的需要,到现在互联网已经基于大数据的分析衍生出很多能够产生商业价值的商业模式,包括基于可穿戴设备的数据处理,包括现在大家炒的很热的像阿里小额贷款,基于阿里商户几年之间积累的信用数据,来给这些商户发放小额贷款,这比原来传统金融征信的方式,其实有了很大的精准性和可靠性,成本有大幅下降。我们看,到今年年初,阿里小贷已经贷出了700多亿的规模,不良率是低于1%的,这对于传统的金融来说是非常好的水平。
而像腾讯、百度,也有类似的产品和服务。当然,这其实都是针对自身的在淘宝上的商户,百度是针对他的广告用户。当然,最近几年RTD,这种精准的广告方式的出现,RTD目前在国内量还比较小,目前也就是3-4%的互联网广告份额,但在美国现在已经占到了20%左右。RTD不是卖传统的广告位,而是由广告商掌握用户的数据,知道他所有用户的喜好偏好,所以给他自己的广告用户提供非常精准的定制化广告服务,我就把这个产品推送到给你最希望看到这个广告人的面前,这就使广告价值得到了大大提升,广告主可以根据广告的质量来进行定价,来进行这样的广告投放,这样就大大提高了广告的精准率。
现在有很多商业模式都进行了大数据的分析,包括学习也在改变,不是原来灌输式的强制性的告诉你要学什么东西,而是根据喜好我要学什么东西,这些都在慢慢改变。
另外,刚才提到了互联网,从互联网加速向传统领域拓展,互联网公司大部分是技术公司,这对传统行业来说,IT只是他业务边缘的一个部门。我们虽然看到现在大数据的应用在慢慢拓展,包括智慧政府,现在可以看到各国在逐渐开放政府的数据引导对数据的深度应用,但现在整体来说,在其它行业领域,还是谈概念比较多,真正实用的案例目前还比较少。
为什么现在传统的行业或者企业,没有把大数据真正研究自身的价值?这也是2013年去年嘎特纳对700多家企业做的调研,对传统企业来说应用大数据最主要的障碍是什么?最主要的障碍是不知道如何从大数据中获取价值。看我们最前面的探讨,实际上大数据中蕴含的价值和如何抽取其中的价值,这个理念还没有形成,大家还没有意识到,所以这也形成了最主要的障碍。