近日,中国管理科学学会大数据管理专委会、国务院发展研究中心产业互联网课题组、社会科学文献出版社共同举办的《大数据应用蓝皮书:中国大数据应用发展报告No.1(2017)》发布会在北京举行。本书是国内首本研究大数据应用的蓝皮书。
蓝皮书旨在描述当前中国大数据在相关行业及典型代表企业应用的状况,分析当前大数据应用中存在的问题和制约其发展的因素,并根据当前大数据应用的实际情况,对其未来发展趋势做出研判。
蓝皮书认为,从应用的角度看,大数据并非一个全新的产业,而是与已有产业融合,对已有模式的改造、升级和替代。制约大数据发展的往往并不是大数据本身,而是大数据所应用的行业和领域原本存在的问题,如行业管制、行政垄断、要素不能自由流动,等等。因此,推动大数据应用的发展,需对不当的行业管理模式进行改革,对既有利益格局进行调整。即便在企业内部,大数据应用也不仅仅是个技术问题,而且是涉及业务流程重组和管理模式变革的问题,是对企业管理能力的一个考验。
大数据应用的三个关键点
大数据应用的三个关键点是数据从哪里来?数据怎么用?成果谁买单?
数据从哪里来?
关于数据来源,普遍认为互联网及物联网是产生并承载大数据的基地。互联网公司是天生的大数据公司,在搜索、社交、媒体、交易等各自核心业务领域,积累并持续产生海量数据。物联网设备每时每刻都在采集数据,设备数量和数据量都与日俱增。这两类数据资源作为大数据金矿,正在不断产生各类应用。国外关于大数据的成功经验介绍,大多是这类数据资源应用的经典案例。还有一些企业,在业务中也积累了许多数据,如房地产交易、大宗商品价格、特定群体消费信息,等等。从严格意义上说,这些数据资源还算不上大数据,但对商业应用而言,却是最易获得和比较容易加工处理的数据资源,也是当前在国内比较常见的应用资源。
在国内还有一类是政府部门掌握的数据资源,普遍认为质量好、价值高,但开放程度差。许多官方统计数据通过灰色渠道流通出来,经过加工成为各种数据产品。《大数据纲要》把公共数据互联开放共享作为努力方向,认为大数据技术可以实现这个目标。实际上,长期以来政府部门间信息数据相互封闭割裂是治理问题而不是技术问题。面向社会的公共数据开放愿望虽十分美好,但恐怕一段时间内可望而不可即。在数据资源方面,国内“小数据”、“中数据”应用并不充分,试图一步跨入大数据时代,借机一并解决前期信息化过程中没能解决的问题,前景并不乐观。另外,由于中国互联网公司业务主要在国内,其大数据资源也不是全球性的。
蓝皮书分析指出,数据从哪里来是我们评价大数据应用的第一个关注点。一是要看这个应用是否真有数据支撑,数据资源是否可持续,来源渠道是否可控,数据安全和隐私保护方面是否有隐患。二是要看这个应用的数据资源质量如何,是“富矿”还是“贫矿”,能否保障这个应用的实效。对于来自自身业务的数据资源,具有较好的可控性,数据质量一般也有保证,但数据覆盖范围可能有限,需要借助其他资源渠道。对于从互联网抓取的数据,技术能力是关键,既要有能力获得足够大的量,又要有能力筛选出有用的内容。对于从第三方获取的数据,需要特别关注数据交易的稳定性。数据从哪里来是分析大数据应用的起点,如果一个应用没有可靠的数据来源,再好、再高超的数据分析技术都是无本之木。
数据怎么用?
数据怎么用是我们评价大数据应用的第二个关注点。《大数据纲要》规划了许多大数据应用领域和方向,包括公共部门和产业领域,实际上是提出了许多需要大数据解决的问题或期待大数据完成的任务。如何解决这些问题,如何把数据资源转化为解决方案,实现产品化,这是我们特别关注的问题。大数据只是一种手段,并不能无所不包、无所不用。我们关注大数据能做什么、不能做什么,现在看来,大数据主要有以下几种较为常用的功能。