三、大数据是经济增长和转型升级的强劲动力
毋庸置疑,中国拥有丰富的数据资源和应用市场优势,拥有全球第一的人口数、互联网用户数和移动互联网用户数,国土面积广、经济体量大,拥有其他国家难以企及的海量数据资源和应用需求潜力。以北京公交为例,北京公交一卡通一天的刷卡量可达4000万次,其中地铁1000万次;使用中国联通的用户上网记录每秒 83万条,对应数据量为每年3.6PB。因此,IDC预计到2020年中国的数据总量将达到8.4ZB,占全球数据量的24%,中国将成为世界上第一数据大国和“世界数据中心”,丰富的数据资源为中国大数据发展带来了肥沃的土壤。
据了解,美国多年前已掌握通过基因大数据分析判断肿瘤的技术,但由于缺少病例样本进展缓慢,中国华大基因公司通过和腾讯公司及医院合作,得到了大量的样本数据,有关技术已经赶超美国。因此,中国互联网大数据应用具备全球领先的潜力,互联网作为天然的数据平台和数据集散地,是大数据发展的起源地和价值蓝海。
中国部分互联网公司在大数据应用方面已经处于全球领先水平。2014年互联网趋势报告中提到,依据月独立用户访问量评出的全球10大网站中有四家来自中国,分别为阿里、腾讯、百度和搜狐。目前,百度、腾讯、阿里等骨干互联网企业已建立了世界上规模最大的大数据平台,单集群规模达到上万台,在分布式系统、 超大规模数据仓库、深度学习等关键技术上有所突破。
与此同时,我们还必须正视中国大数据发展亟待解决的突出问题。正如习近平总书记在讲话中指出的:“我们的国家治理中存在信息共享、资源统筹、工作协调不够等问题,制约了国家治理效率和公共服务水平。这个问题要深入研究。我们提出推进国家治理体系和治理能力现代化,信息是国家治理的重要依据,要发挥其在这个进程中的重要作用。要以信息化推进国家治理体系和治理能力现代化,统筹发展电子政务,构建一体化在线服务平台,分级分类推进新型智慧城市建设,打通信息壁垒,构建全国信息资源共享体系,更好地运用信息化手段感知社会态势、畅通沟通渠道、辅助科学决策。”
要看到我们在大数据关键技术以及核心技术等方面还有短板和不足。例如我们在数据处理分析、语音识别、视频识别、商业智能软件、数据中心建设和维护、IT咨询、信息安全等领域都已有代表性的企业,可初步构成获取、存储、处理、应用的产业链;但更要正视中国大数据发展亟待解决的突出问题,其中一个突出的问题就是政府数据开放共享不够,潜在价值大量淹没。政府和公共部门是最大的信息数据生产、收集、使用和发布的单位。但现实情况是,海量的数据分散在各个部门、各个层级,彼此分割,形成一个个“信息孤岛”,且对社会、公众开放严重不够。由于数据开放程度不足,大量的政府数据处于“休眠”状态,而企业拥有的大数据技术和计算能力却无用武之地,陷入“巧妇难为无米之炊”的状态,潜在的价值损失不可小视。这就导致了政府大数据应用水平落后,缺乏数据治国意识。在传统环境下,管理者很难 全面获取公众需求、人口流动、人员结构、企业状态等数据,形成了做决策靠经验判断的惯性思维。
据一项针对中国主要部委信息化部门的调查,政府部门目前几乎没有使用大数据技术,近四成负责同志并没有意识到大数据可以帮助提升业务能力。三峡工程等重大工程建设过程资料均未电子化,大量纸质文档已经遗失;汶川和玉树抗震救灾等重大事件的过程也未形成电子化档案,珍贵的记录已经难以重新展现;社会信用、食品药品安全等一些社会管理和公共服务系统更多形成的是结果和状态数据,大量的过程和行为数据并未有效采集,占数据总量95%以上的非结构化数据被束之高阁。这些重大工程、重大事件的数据如能够得到合理保存并加以开发利用,将有极大的科技价值、经济价值乃至历史价值。
在大数据时代,数据控制力是国家战略控制力,掌握了数据就掌握了话语权。但目前我们对数据控制力尚未引起足够重视,数据话语权堪忧。目前,中国大数据发展 形态较为单一,核心技术仍受制于人,虽然以阿里巴巴、百度、腾讯为代表的互联网企业已经在大数据应用领域超前部署,处于世界一流水平。但与已经出台大数据国家战略的美英日等发达国家相比,前一阶段中国大数据发展主要表现为互联网企业自发的商业行为,发展形态比较单一,仍只是一个领域、几家企业的单点开花, 缺乏国家层面的统筹规划和全面布局,长此以往将影响国家对数据的掌控权和控制力,不利于提升国家信息优势和国家竞争力。