大数据产业“黄金期”面临四道坎

百分点集团副总裁兼EBG事业部总裁高体伟介绍,百分点智能制造全价值链一体化平台已成功应用于汽车制造、3C制造、消费品制造等众多行业,帮助企业实现设备异常监控与预测、零件生命周期预测、良品保固分析、产品精准营销、个性化推荐,以及产品购买用户的情感分析、产品优化设计、品质追溯查询等,助力制造企业在生产、管理和营销各环节的转型。

据了解,百分点通过对用户数据、日志数据、家电机器状态等数据的分析发现,智能电视用户使用VGA接口的人不到1%,为一家生产制造企业节约几千万元成本。

四大难题亟待破解

去年,菜鸟和顺丰的“数据断交”事件,暴露出大数据发展中的数据共享难题。当前,我国大数据产业正在从起步阶段步入黄金期,数据开放度低、技术薄弱、人才缺失、行业应用不深入等都成为产业发展中亟待解决的问题。

首先,记者通过在贵阳、杭州、北京等地的采访了解到,我国信息数据资源80%以上掌握在各级政府部门手中。近年来,在《关于推进公共信息资源开放的若干意见》《政务信息系统整合共享实施方案》等文件的推动下,政府数据加快了共享开放的步伐,惠民成绩单亮点不断。然而,由于我国大数据发展还处在起步阶段,不少基础性、关键性数据仍被政府部门束之高阁,共享开放程度低,这已经成为现代化治理进程中的“路障”。

据贵州省大数据发展管理局相关负责人介绍,部分政府部门在数据收集的过程中,由于缺乏统一的标准,收集到的数据虽然量大,但质量不高,可利用价值低。据此前媒体报道,长江上游地区一些省份的交通管理部门、运输公司不愿与其他省市共享物流信息,造成联运衔接的信息壁垒,甚至出现了同样1吨货,一百公里公路运费比经济发达地区高60元的现象。

据了解,截至2016年底,广东省全省87个省直部门有6988类数据资源、62332项信息项,居全国各省(区、市)首位。但各部门提出的共享需求仅3649类,省级编目共享仅477类,数据难以真正发挥利民惠民、支撑政府决策的作用。

此外,尽管部分数据已接入共享开放平台,但由于不能被机器读取,成为无法释放应有活力的“休眠数据”。《2017中国地方政府数据开放平台报告》显示,截至去年4月,全国19个地方政府数据开放平台的8398个开放数据中仍有约25%的机器可读性较差。

中国科学院院士、北京大数据研究院院长鄂维南表示,“理论上我国有很多数据,但实际做数据分析会发现利用起来非常困难。”贵阳大数据交易所有关人士透露,不少企业以保护商业机密或节省数据整理成本等为由,不愿意交易自身数据。部分政府部门也缺乏数据公开的动力:有的是因懒政而让数据沉睡,有的则是已经利用数据开展商业化应用,不愿共享。

其二是技术创新滞后。我国大数据产业虽然与国际大数据发展几近步伐相同,但是仍然存在技术及应用滞后的差距,在新型计算平台、分布式计算架构、大数据处理、分析和呈现方面与国外仍存在较大差距,对开源技术和相关生态系统影响力弱。市场上,由于国内大数据企业技术上的不足,用户更加青睐Google、IBM、Oracle、SAP等国外IT企业。

微软大中华区董事长兼CEO柯睿杰认为,数据智能并非那么触手可及。大数据来源众多、数量巨大、形式各异,要从中获得一目了然的信息,就需要真正高效、可靠的数据管理和分析平台。

如何处理巨量数据是中国大数据产业面临的首要技术问题。鄂维南表示,“中国的数据体量特别大,比如,中国的视频比任何国家都要多,这些数据储存困难,需要用的时候往往就没了”。再以基因测序领域为例,中国每年新增的基因组测序原始数据超过20PB(1PB相当于100万GB),面临数据量大、数据处理流程长等技术挑战。

目前,我国大数据技术创新能力还有待提升。《大数据产业发展规划(2016-2020年)》指出,我国在新型计算平台、分布式计算架构、大数据处理、分析和呈现方面与国外仍存在较大差距,对开源技术和相关生态系统影响力弱。同时,大数据应用水平不高。我国发展大数据具有强劲的应用市场优势,但是目前还存在应用领域不广泛、应用程度不深、认识不到位等问题。

“我国大数据在底层技术上和国外差距特别大,技术都来源于谷歌等国外大公司。”国务院发展研究中心信息中心研究处处长李广乾说,很多时候我们的商业模式走在了技术前面,但并没有通过技术手段来推动创新。