互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。
中国信息通信院高级工程师韩涵
其中在28日下午举行的“大数据征信与数据流通”分论坛上,中国信息通信院高级工程师韩涵博士做了精彩的演讲。
以下是韩涵的演讲实录:
给大家分享的题目是建设规范的数据流通环境,在座的各位嘉宾有参加昨天上午的论坛,有看到我们单位发布的数据流通行业公约,这个报告以这个公约作为起点,给大家讲一讲我们如何关注数据流通行业,以及对于行业发展的思考。一个是我国大数据产业链调查结果,第二是数据流通行业存在的问题和思考,最后是我们的建议是行业自律的方式改变我们产业发展环境。开幕式当天放过的PPT从产业的视角、从数据资源的脉络里将大数据的产业链分成生产流通应用的环节。生产环节包括数据采集加工清洗等主要模块,在数据流通我们认为主要是包括数据的转移共享置换交易等这样的行为,而这个数据应用是大数据与各行各业的结合。在数据生产和加工这块有很多典型的企业,大家都不陌生,在数据流通环节全国有若干个数据交易中心的平台,在数据分析应用环节有专业数据公司和行业内部对大数据应用的企业。
大数据并不是只对大数据本身的产业发挥作用,因为根据调查结果2015年大数据产业产值是一百亿的规模,相对全国信息技术的产业来说是非常小的。但是我们认为大数据能够带来多种行业的变革,包括对一产二产三产的影响,他的路径是从第三产业向第二第一产业逆向融合渗透的方式,比如今天比较火的工业未来可能向农业有深入,我们为了了解大数据产业链上各个单位的情况进行了一轮比较广泛的市场调查,调查的企业上百家收回了完整的调查问卷53份,主要是以数据流通产业链的链条为基础,覆盖了上中下游的各种企业。参与调查的单位主要是企业为主,53家单位48家是企业,事业单位和科研院所比较少,覆盖的范围从信息通信电子商务金融教育培训交通等等都有,这次是一个抽样性的市场调查,范围还是比较广泛的。这个市场调查之前在互联网上公布,这个企业是自主申报的,并不是我们挑选的企业,这次市场调查结果反映大数据对各行各业的影响,各个企业看到了我们对大数据的市场调查给予我们非常高效的反馈。
根据这个结果我们可以看到当前企业掌握数据资源总量非常大,根据昨天的饼图,在1Pb以上的紫红色的部分已经接近了一半,当前企业数据资源总量是相当大的规模,另外技术型的企业,做数据分析建模数据服务和设计的企业,这个是大于数据交易和采集类的企业,技术型企业是市场主流,数据交易和流通是非常活跃的,交易还是主要的方式,企业数据来源调查结果有80%的企业认为企业数据来源第一项是数据交易,高于数据收集和置换的方式,数据的结构来看,最大的比例是结构化的数据,有85%的企业认为搜集到的数据包含结构化的数据。可以看到这个柱状图里对于准结构化的,比如文档和网络的数据以及社交媒体的数据的差距已经不是很大了,这也说明非结构化的数据逐渐的产生了他的价值。我们再看这个市场规模,这个问题非常敏感,根据我们市场调查,年度交易额五百万以上的数据,占到34%,这个数据交易市场规模是有一定的规模效应。另外这个收费模式,主要还是向买方收费为主,仅向买方收买45%,买卖双方收费10%。同时,我们看到对于大部分的企业来说专门成立了数据流通部门,和其他相关企业进行数据的转移交易交换的行为设立专门部门,61%的企业设立了专门部门,大家对数据流通的重视程度非常高。收费模式现在主要是按照数据量计费最大规模,占64%,按照数据处理难度使用的时间和数据获取难度有一些考虑,除了数据量以外兼顾数据成本的投入。