大数据:热潮中切忌一哄而上 科学规划很重要

不同行业从不同角度发现了数据爆炸的挑战和机会。最终,大数据频频见诸媒体,成为达沃斯等国际峰会上的热词,但就如前述报告所显示的,企业家对这一概念并无把握。

数据公开让美国占得先机

大数据商机显现后,2012年3月,奥巴马政府发布《大数据研究与发展倡议》,同时组建“大数据高级指导小组”,标志着美国把大数据提高到国家战略层面。

国防大学教授胡晓峰说:“我认为奥巴马试图通过大数据发展计划,再次重复信息高速公路计划带来的互联网霸权。美国人已经把目光瞄准到大数据的未来领域,我觉得是为了创造未来的大数据霸权奠定基础。”

“美国政府提出大数据计划的根源,在于有十几年以上数据公开的基础。”北京理工大学教授丁刚毅说,美国的DATA.GOV网站就体现了政府公开数据的力度,“大家可以上网看,DATA.GOV的数据量非常大,和世界银行、联合国的数据都可以媲美。里面很多都是敏感数据,但它就是敢公布,认为只有公布这样的数据,才能有更好的国际合作去应对危机。欧盟、英国,包括巴西这样的发展中国家,都已经加入了DATA.GOV”。

丁刚毅说,在数据公开上,联合国组织和美国的一些研究机构在全力以赴,已经有10年了。每年还有各式各样的活动促进数据公开。

美国数据开放,使不少基于政府数据的服务,创造了巨大效益。比如硅谷有一家“气候公司”,利用美国气象局数据库中几十年的天气数据,研究各地降雨、气温、土壤状况与历年农作物产量的相关度,预测农场下一年的产量,以出售保险。这家公司由于前景光明,最近被农业巨头孟山都公司收购。

还有利用气象信息和航班误点信息来预测航班误点几率的服务,可以推动航空公司提高正点率。再如城市治堵,政府的数据也排上了用场——美国和英国最早利用大数据管理交通,给出交通预测,让公私车辆适时出行。

对于政府数据公开的益处,美国商务部首席信息官西克曼在一次IT会议上说:“政府实现预期目标的真正障碍不仅在于收集数据,更在于如何将数据转化为切实可用的信息产品以及开发知识。”

“毕竟很多有能力提出好点子的人才分散在各个私有组织,他们也许会提出一些关于数据利用的优秀方案。”西克曼说,“分享我们的数据,并不只是为了追求所谓政府事务的透明度,这真的有可能以全新方式,让我们产生并传播的数据迸发出别样的力量——而这一切在我们现有的规划及有限的资源面前根本无法实现。”

丁刚毅说,他曾跟国内一些著名的互联网公司接触过,申请共享其数据,公司表示“给你一段可以,几百个TB也好,几个PB也可以,但连续的数据绝对不可以”。他认为,对于研究者,长期不断、随时随地都可以接触的数据,才是大数据。

“政府和行业共享数据应该是大数据的基础,离开共享政策,根本就没有大数据。”丁刚毅说。

大数据繁荣需共享+立法

中国人对大数据的关注并不晚。2012年7月,我国《“十二五”国家战略性新兴产业发展规划》明确提出,要“加强以海量数据处理软件等为代表的基础软件的开发”。2012年12月,中关村大数据产业联盟宣布成立。

根据IT分析公司IDC预测,中国大数据技术与服务市场将快速增长到2016年的6.16亿美元。但这一数额仅仅是世界市场的一个零头。

网络研究专家秦安在接受媒体访问时表示,中国设立大数据机构从时间上看,似乎并不落后于美国,但大数据应用涉及整个以互联网为核心的产业链,美国在大数据应用上的领先程度由思科、微软、谷歌等跨国IT公司的实力所决定,恐怕中国几十年内难以完全超越。

9月30日,中共中央政治局在中关村调研时,百度公司CEO李彦宏就宣讲了大数据的题目。他认为大数据在两方面最有价值,一是促进信息消费,加快经济转型升级;二是关注社会民生,带动社会管理创新。李彦宏同时表示,国家层面要发展大数据,就要促进数据开放,扶持科研、培育人才。

这种“数据开放”的观点,代表了中国大数据行业观察者的共识。互联网评论家葛甲指出:“数据开放在割据状态的互联网上靠企业的力量是完不成的,只有从政府层面去进行推动。现在做大数据的公司这么多,其实多数只有个壳子,没有实际内容。大数据的基础是巨量数据,不具备一定程度的数据量,是做不成的。于是,李彦宏提出了数据开放这个概念。”