宁家骏:新形势下推进大数据应用的若干思考

大量案例表明,很多小规模企业,尤其是初创企业,通过大数据手段,能够“小而精”“快而准”地针对一个行业的实际需求,创造出改变世界的革新性产品。随着信息化的深化发展,大数据的核心价值将进一步凸显,成为商业模式创新的驱动力。党的十八届五中全会指出:“深入实施创新驱动发展战略,坚持创新发展,必须把创新摆在国家发展全局的核心位置,不断推进理论创新、制度创新、科技创新、文化创新等各方面创新,让创新贯穿党和国家一切工作,让创新在全社会蔚然成风。”培育发展新动力,就要充分发挥大数据资源这一新生产要素的作用,释放新需求,创造新供给,推动新技术、新产业、新业态蓬勃发展,拓展发展新空间中的一个支点就是实施网络强国战略,实施“互联网+”行动计划,发展分享经济,实施国家大数据战略。特别是2016年4月19日习近平总书记在网络安全和信息化工作座谈会上所作的重要讲话中明确提出:“当今世界,信息化发展很快,不进则退,慢进亦退。我们要加强信息基础设施建设,强化信息资源深度整合,打通经济社会发展的信息‘大动脉’。党的十八届五中全会、‘十三五’规划纲要都对实施网络强国战略、‘互联网+’行动计划、大数据战略等作了部署,要切实贯彻落实好,着力推动互联网和实体经济深度融合发展,以信息流带动技术流、资金流、人才流、物资流,促进资源配置优化,促进全要素生产率提升,为推动创新发展、转变经济发展方式、调整经济结构发挥积极作用。”总书记高瞻远瞩的重要讲话为新时期发展大数据及其应用指明了方向,规划了美好的蓝图。

三、大数据是经济增长和转型升级的强劲动力

毋庸置疑,中国拥有丰富的数据资源和应用市场优势,拥有全球第一的人口数、互联网用户数和移动互联网用户数,国土面积广、经济体量大,拥有其他国家难以企及的海量数据资源和应用需求潜力。以北京公交为例,北京公交一卡通一天的刷卡量可达4000万次,其中地铁1000万次;使用中国联通的用户上网记录每秒83万条,对应数据量为每年3.6PB。因此,IDC预计到2020年中国的数据总量将达到8.4ZB,占全球数据量的24%,中国将成为世界上第一数据大国和“世界数据中心”。丰富的数据资源为中国大数据发展带来了肥沃的土壤。

据了解,美国多年前已掌握通过基因大数据分析判断肿瘤的技术,但由于缺少病例样本进展缓慢,中国华大基因公司通过和腾讯公司及医院合作,得到了大量的样本数据,有关技术已经赶超美国。因此,中国互联网大数据应用具备全球领先的潜力,互联网作为天然的数据平台和数据集散地,是大数据发展的起源地和价值蓝海。中国部分互联网公司在大数据应用方面已经处于全球领先水平。2014年互联网趋势报告中提到,依据月独立用户访问量评出的全球10大网站中有四家来自中国,分别为阿里、腾讯、百度和搜狐。目前,百度、腾讯、阿里等骨干互联网企业已建立了世界上规模最大的大数据平台,单集群规模达到上万台,在分布式系统、超大规模数据仓库、深度学习等关键技术上有所突破。

与此同时,我们还必须正视中国大数据发展亟待解决的突出问题。正如习近平总书记在讲话中指出的:“我们的国家治理中存在信息共享、资源统筹、工作协调不够等问题,制约了国家治理效率和公共服务水平。这个问题要深入研究。我们提出推进国家治理体系和治理能力现代化,信息是国家治理的重要依据,要发挥其在这个进程中的重要作用。要以信息化推进国家治理体系和治理能力现代化,统筹发展电子政务,构建一体化在线服务平台,分级分类推进新型智慧城市建设,打通信息壁垒,构建全国信息资源共享体系,更好地运用信息化手段感知社会态势、畅通沟通渠道、辅助科学决策。”

要看到我们在大数据关键技术以及核心技术等方面还有短板和不足。例如我们在数据处理分析、语音识别、视频识别、商业智能软件、数据中心建设和维护、IT咨询、信息安全等领域都已有代表性的企业,可初步构成获取、存储、处理、应用的产业链;但更要正视中国大数据发展亟待解决的突出问题,其中一个突出的问题就是政府数据开放共享不够,潜在价值大量淹没。政府和公共部门是最大的信息数据生产、收集、使用和发布的单位。但现实情况是,海量的数据分散在各个部门、各个层级,彼此分割,形成一个个“信息孤岛”,且对社会、公众开放严重不够。由于数据开放程度不足,大量的政府数据处于“休眠”状态,而企业拥有的大数据技术和计算能力却无用武之地,陷入“巧妇难为无米之炊”的状态,潜在的价值损失不可小视。这就导致了政府大数据应用水平落后,缺乏数据治国意识。在传统环境下,管理者很难全面获取公众需求、人口流动、人员结构、企业状态等数据,形成了做决策靠经验判断的惯性思维。