大数据恐慌

发展大数据产业是对政府官员思维模式、行政方式的巨大颠覆。大数据是什么?大数据产业包括什么?这个基础问题既简单,又很难,因为这是主要由市场定义,甚至可以说由国外几个科技公司、几个人来定义的,而市场难以形成共识,同时产业变革日新月异

目前比较通行的定义是:大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到,无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。

公开资料显示,在1980年,著名未来学家托夫勒在其所著的《第三次浪潮》中就热情地将“大数据”称颂为 “第三次浪潮的华彩乐章”。

“云计算和大数据是一个硬币的两面,云计算是大数据的IT基础,而大数据是云计算的一个杀手级应用。”微软公司全球资深副总裁、微软亚太研发集团主席张亚勤说,“30年前,存储1TB也就是约1000GB数据的成本大约是16亿美元,如今存储到云上只需不到100美元;但存储下来的数据,如果不以云计算进行挖掘和分析,就只是僵死的数据,没有太大价值。”

国外对大数据的开发、应用,主要由市场主导。最著名的实例就是Google搜索引擎,面对海量Web数据,Google于2006年首先提出云计算的概念,支撑Google内部各种“大数据”应用的,正是Google公司自行研发的云计算服务器。而对“大数据”进行收集和分析的设想,来自于世界著名的管理咨询公司麦肯锡公司。

因此,市场的绝对主导,就导致中国地方政府在发展大数据产业时,比较被动地去理解企业的需求,而很难占据主导或引领地位,再加上由于互联网行业的日新月异,政府连规划都很难做得准确。“不要考虑3个月后的事。”当记者问某地方政府科技处官员关于其未来规划时,该官员用一家互联网企业高管的话回答记者道。

同时,政府官员被逼着成为“专家”。“我每天要花至少1小时来学习,不学习你都没法跟企业沟通。政府人员的压力非常大,几乎平均是每周7天,每天12个小时的工作量。”贵安新区管委会主任马长青告诉记者。

不过要注意的是,目前中国国内的大数据应用,分为官方主导、市场主导两类。秦皇岛经济与技术开发区科技局副局长,就是由秦皇岛(中科院)技术创新成果转化基地的主任丁琳博士兼任。丁琳告诉记者,秦皇岛经济与技术开发区目前实际落地的项目,主要是承担政府或中科院主导的项目,他们的数据主要来自国家级项目,开发的应用也主要用于航空航天、农业等,用户也主要是政府。

战略定位:大而全?专而精?

大数据基地建设正在全国形成差异化的局面。以秦皇岛为代表的已有多年经验的数据基地,做的主要是应用领域,而贵安新区等刚开始的后起之秀,目前主要在第一个环节,即大数据的存储

“大数据产业链很长、很庞大,可能没有任何一方能够垄断整个产业链,各方都只能做其中的某一部分,能把其中的某些环节做好,就已经非常不错了。”秦皇岛经济技术开发区外联处主任王继军告诉记者。

英特尔公司中国研究院院长吴甘沙向记者介绍,大数据产业链基本可以分为三大类环节:数据的收集与存储(数据拥有者),数据的处理与分析(数据技术提供者),第三个方面是数据价值与附加值提升(具有数据思维的点石成金者),比如各种大数据应用。

而吴甘沙强调,大数据与产业结合才能实现数据的价值,“否则数据就只是数据,甚至是负资产。例如,大数据与零售结合,可以实现对消费者的精确洞察,商品的灵活定价和供应链的高效管理;与农业、金融业结合,实现对农产品种植的精细管理以及灾害保险”。

如果按照吴甘沙对大数据产业的三大分类,以秦皇岛为代表的已有多年经验的数据基地,做的主要是应用领域,而贵安新区等刚开始的后起之秀,目前主要在第一个环节,即大数据的存储。

不过,贵安新区、重庆两江新区也不甘于只是做存储,大数据资源的集聚,只是第一步,他们正在努力实现“大而全”与“专而精”的结合。“数据资源的集聚,是基础;有应用市场,是产业集聚的动力。没有一定规模的数据中心,谈不上数据资源的聚集。”

与秦皇岛“花5年打基础”相比,贵安新区则显得更“急迫”:一年完成基础设施构建,两年完成要素集聚。欧阳武介绍贵安新区建设数据中心规划:一是基础环境构建期(2014-2015年),重点完善园区基础设施建设,加快大数据产业孵化园建设,建设基础设施云计算平台,加强城市配套设施建设。二是要素资源集聚期(2015-2017年),重点是推进数据资源集聚、技术要素集聚、资金要素集聚、人才要素集聚、企业要素集聚。三是应用创新突破期(2017-2020年),重点提升产业链支撑能力,推动数据资源交易使用,推进大数据应用创新,发展大数据服务业务。