中国科学院院士怀进鹏:大数据及大数据的科学与技术问题

我们很清楚,只有疾病控制中心确认患得甲流的症状以后,才能把各地的数据统计放在国家疾控中心。这个时间在候诊、确认到上报,一定是两三周。之所以谷歌能发现这个事情,它是通过在全国、全球分析用户的键入习惯和行为进行提前预警。根据用户查询的症状和方案,以及咨询,完全是根据互联网在线的信息来挖掘社会可能面临的问题。比如像阿里巴巴,马云跟我讲他曾经有金融危机的预感。原因就是在他的电子商务交易当中,实时交易中的支付出现了大幅度的下降。正常的情况是到圣诞节之前,采购计划应该提前半年发单。可是3月份没有、6月份没有,到9月份还在下滑的时候,对于我们的中小企业来说,制造业就出现了新的问题。还有百度,4亿用户来分析提供的个性化搜索。

我们也知道在西方,利用微博、社交网络创造了很多新的价值,比如说根据民众的情绪或者对某一只股票的影响,对冲基金可以根据对企业的分析决定是否购买股票,以及对于上市的企业是否破产,都可以给金融分析进行帮助。另外,还可以了解另外一些人对什么感兴趣,我们传统上有一些例子,将婴儿的尿布、奶粉和香烟放在一起,是一种方式。也有一种对应策略是将婴儿奶粉和香烟隔的距离远一些。一种方式是顺手牵羊,另一种方式是可以保证多留在商场的时间,刺激消费。这些都是通过对实际行为的判断和分析,在统计规律基础上做出来的。

4. 大数据的实际价值

实际上在数据的经济社会发展的价值当中,体现了我们如何对它进行归类和分析,并进行有效的预测。因此,拥有大数据,拥有大规模真实可运行的数据,并能够对它进行分析和处理,也许就是我们不断提高竞争能力的重要力量。

在这个方面,大数据未来投资和发展的价值有多大,实际上在去年的时候,Gartner进行了预测,他认为云计算和大数据的发展将在未来获得重要的机会。当然,咨询预测总是有风险的。从他的角度来看,2016年在全球大数据的发展当中将会出现新一轮的重大机遇。同样,他还进行了另一个分析,对当前大数据的投资领域来看,给出了当前已经超过30%左右和未来进一步投资领域的划分,列举了像教育、交通、医疗等,在这些领域可能,并且已经正在投入的行为。