中国信息通信院研究院副主任兼大数据工作组组长魏凯:中国大数据产业发展与标准

在中国,我们的研究院和经济研究所做了一个分析,大概是0.6%到0.8%这样一个水平。间接经济很大。各国非常重视。美国大家都有所了解,美国前几年关注正面的,关注怎么来促进大数据的发展,他除了一系列政策,包括开放数据,包括孵化开源软件,前天我们医院跟美国夏威夷大学的一个教授在交流,他们在很重要的讨论的一个问题就是,大数据可能会带来歧视,比如大数据的推荐系统可能会嫌贫爱富。

大数据的广告,可能会让这个社会更加不公,这些是他们现在关注的人类终极价值的问题。美国,欧盟,英国,日本,他们都在把大数据作为一个很重要的话题在讨论,正面的,负面的,落地的政策的,这些都在去关注一些法律的完善。总的来说,各国政府是非常重视大数据的发展,我们国家的情况怎么样,大家可到,我们这里大概对国内的大数据的核心的产业的这些公司,做了一个梳理,大概分为三个环节,2016年大数据的图谱做了一个简化,我们大概分成三个环境,第一个环节就是有谁在做数据的供应,数据清洗数据的交换,比如从数据供应上,可能有很多的手里持有数据的人的作用,比如说运营商,银行,航空公司,这些人,其实已经开放了很多API来供大家调用,还有一些数据交易所,中游的有很多做平台,做产品的人,像这里头列到的,包括今天待会儿会讲到的一些公司,在做发行版。

从上游来看,我们也面临的问题,就是数据的供应非常短缺,你看你们的客户肯定都在说,你在给我做应用的时候,最好能给我找到一些数据,但是政府数据,我们国家政府数据的供应,其实是很滞后的,开放程度很低,那么有很多地方在实践,这个其实我们认为,开放数据在中国可能会存在非常大阻力,利益格局的问题,责权力的问题,政府在开数据的时候,它们没有授权,另外一个是得不到很多的好处,其实是阻力很大,阻力大于动力,数据开放的事儿,有很多的问题,主要的问题其实是这个责任和权力的问题,还有就是数据交易所,我们国内,几乎每个月,都会成立一个数据交易所,你看现在,已经公开已经成立了也十几个交易所,数据交易所其实非常火,但实际上,他的成交,他的撮合,其实很不活跃的,因为大家还都有顾虑,对于数据交易平台,承担什么的责任义务,其实心理没底,这个平台是一个黑盒子,另外有数据的人,其实很难去做决定,把数据拿到上面去卖,他的利益,可能他衍生的问题,自己没有保障。

所以说数据交易平台,这个事情,其实在探索中,还是在等待这个制度的完善,模式的成熟,最重要的问题,其实是责权力,责权力不对等,导致一方面,黑市的数据交易很活跃。另外一方面,有数据的人,其实不敢拿出来跟人合作,他的红线是不清晰的,什么数据可以交易什么数据不能交易。然后他的定价水平,其实是不足以来让他做决定的。

比如说像一个地铁,像公交一卡通的公司,他们的数据到底能够值多少钱,谁也说不出这个价值来,他怎么来界定他数据资产的价值,其实在这里头,责任非常不清晰的,还需要较长时间的探索。

在技术创新上面,我们可以看到在国际上有三个阵营,我们不知道认同不认同,有一批原创的,他们天天去发各种各样的论文,比如在国际顶尖会议上去发一个论文,而且这个论文,其实不是停留在一个图书馆里头的论文,他的论文,其实对产业界的影响力非常大,会孵化出很多新的项目,大家很多开源软件,照着这些论文去实现,对产业界影响很大。整个来说,应该是一个三大梯队的状况,有一批人,像谷歌,像美国的这些前沿的研究所。包括我们中国我们看到,计算所在前沿技术上,也贡献越来越了。还有一类做开源软件的。这类人,其实以开源社区为纽带,把他们串起来,对业界贡献也是非常大的。没有开源软件,其实大数据技术发展不起来。

第三个环节,我们很多的厂商。在把开源软件转化成产品方面做了很多的贡献,国内的这些技术开发商,这些软件平台提供商,可能大部分我们感觉到,应该处于第三个梯队,就是产品供应,其实对于前沿的技术方向引领,架构的引领,其实还有待进一的去努力,短期内,很难改变这个格局,应用方面,国内到底情况怎么样像刚才说的,行业应用上没有大规模的启动,还是在两端。两端的迫切性非常高。一个是互联网公司,自建,自用,他们的大数据系统,很早在部署。因为他们的广告,他们的核心业务,其实就跑在大数据上,另外一段,是政府这一端。我们看到在公安、税务,政府很多监管部门,他们对大数据的项目的需求是非常强烈的,另外政府热还有一个方向就是他要拉动产业的发展,所以两头非常热。其他的行业,其实发展的水平参差不齐。