第二个观点,技术创新是非常活跃的,待会儿会有中科院和生物工厂的几位同事可能会讲到技术创新的方面,从2000年左右到现在,大数据在短短这么几年的时间里,它经历了很多代的技术变迁。
这样底层的技术,这么多年一直在变化,之后一直在演进,而且性能成熟度提升的非常快。从原来的可能刚开始大数据技术,在企业里头,其实是一个外围的,第二平面的一个他的平台,现在逐渐进入生产系统,比如说很多银行的放贷系统其实已经把数据用到他信用评估里头去了。很多的贷款其实不要信贷员去做评估而是一个通过数据系统去做评估,来决策这个贷款地实际上进入这样一个状态,那随着底层技术的稳定,成熟,给上面的应用,给业务人员提供了很大的创新的空间。
比如说我们现在的机器学习,流分析,交互分析,慢慢地越来越多得应用在企业里,这是底层技术的,我们有一个看法,共性技术沉淀,越来越完善。
第三个方面,就是大数据应用,现在面临着一个问题,大数据不管在金融、电信、医疗等等这些行业,它的应用还没有到产生价值的爆发点。我们认为其实还处在非常初期的阶段,美国也是这样。所以在大数据的整个应用中,还没有到最高用户,决策层的事业里,大家是一个尝试性小试牛刀的阶段。
我们在国内的感觉也是一样的,这些银行,这些保险机构,他们的大规模的大数据的采购。大规模的大数据部署,还正在尝试中没有很明显的一个飞跃,未来应用其实最关键,应用要创造价值,应用我们看到有两个维度在演进,一个维度是,他需要多元的数据,原来可能是我在数据库上做分析那么未来可能数据仓库,很多工业系统,连数据仓库都没建起立,这是把跨部门的内部数据整合起来,未来还要把外部数据做整合,不仅要建内部的数据仓库,还要建开放式的数据生态,调用外部的API去做一些决策。这是数据员的方向,还有一个是挖掘算法不断的智能化,从现在我们只能做报表只能做历史帐单的查询,这是最简单的应用,到未来,可能会有一些预测性的,决策性的,比如说互联网上,最成熟的大数据系统,其实是市制竞价广告这类的,他不需要人决策,他是一个闭环的。但是在很多企业应用里头,其实没有形成这一个智能的,自动的闭环这样一个数据的应用的系统,所以应用的智能化水平,可能也是未来会逐步的提升,两个角度,一个是数据越来越多,一个是算法学习智能。这是两个途径。
从产业生态上来看,我们观察大数据产生的意思是什么,谁在做这个生意,有真正生意,大数据里头有什么生意可以做呢,有人在2012年的时候,画一张图,大数据里头有提供技术的,有提供数据分析工具的,有提供垂直行业的应用的,2012年,可能大家看到已经很多人在做了,这是国际上的一个趋势可能很小,大家仔细看,看不出来,分辨率不高的话,看不出来。我的一个核心意思是想讲这样的问题从2012年到2016年,这个生态的演化速度非常的快,2012年这个环节,做大数据生意环节其实很少,有十来个不同分工的环节,到了2016年就非常的复杂,他的分工越来越细,越来越专业,比如我们在基础设施这块的有做私有云的解决方案的,有在公有云上做大数据分析服务的在垂直行业里头,他更进一步的细分成了传媒的,医疗的等等很多行业。整个生态不断的在繁衍在细化,非常的活跃,这是国际上的一个情况。国内也是这样,稍候会有一个详细的介绍。
为什么大家都很关注这个事情,特别是在国家层面上,美国政府在2012年出台大数据行动战略,欧盟在2014年出台了一个文件叫打造数据驱动的新经济。欧盟未来可能希望用数据驱动来给他创造很多价值,为什么大家都这么关注,为什么领导们这么看中大数据的这个技术,我们这里也是采集了各方面的分析。
其实从狭义来看,大数据的产值,比如说卖软件,卖硬件,卖服务,这个狭义的产值,其实是不大的,比如全球统计下来,这三块的产值是300亿,这是狭义的SAT的产业里头的产值,大概300亿美元左右,我们对中国的也是做了统计,大概一百亿美元的量级,这个量级在整个的经济里头,在整个信息产业里头都算比较小的这样一个规模。但是他的间接价值很大,有人把他做过比喻,就像蜜蜂和蜂蜜的产值关系一样,如果大数据的直接产值,相当于蜂蜜的一年的产值,比如说一年蜂蜜,可能有几十亿人民币的产值,但是如果你要把蜜蜂的价值,衡量出来,他其实是很大的,他如果没有蜜蜂,他的整个农作物就崩溃了这个体系。大数据也是,他的间接价值是非常大,也很多算法估计这个,大数据对于GDP,对于工业,对于服务业的拉动。