中国IDC圈4月29日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。28日上午,在数据中心联盟、中国智慧城市产业技术创新战略联盟协办的地方大数据产业发展论坛中北京大学软件所副所长黄罡先生做了精彩的演讲。
北京大学软件所副所长黄罡
以下为黄罡演讲实录:
黄罡:非常高兴来这个论坛和大家分享我们北京大学在政府数据开放方面的一些工作。其实就大数据来说,我个人认为互联网,BAT搞大数据,实际上是垃圾数据里面去挖金子。但是,其实在中国,因为我们过去十年以部委为中心进行了政府信息化建设的提升,我们的政府信息过程政府数据实际上本身就是金子。所以,只不过这些金子藏在一个个以部门为中心的信息孤岛里面。所以,我个人认为政府做大数据考虑的不是像BAT这种互联网大数据,更多考虑怎么能够尽快的把这些已经是金矿的数据拿出来,怎么让这些金矿变成更大的辅助我们国家去做治理。
信息孤岛这个词大家听过了,去年国务院发布的《大数据行动发展纲要》,当然是举国欢庆,包括厂商,包括地方政府。但是,我们自己看这个纲要里面实际上藏着一些数字。我们通过对神州数码、中软、东软等这些有资质的企业进行调研,基本上一个典型的政府信息系统,如果是一个孤岛式的,它的开放成本一般是1000人/天。这意味着我们的政府信息系统现在至少十万个以上,这样开放下来,至少达到1亿人/天。政府给了时间点,在2020年对外开放。我们以2018年为时间点,短短两年半的时间,如果要利用1亿人/天实现政府数据开放,需要的中高端软件工程师20万。我们中国现在正儿八经的软件工程师也就是几十万。所以,抛开互联网、产业、物联网,光政府数据开放现在就需要20万个软件工程师给我们干活。这20万个软件工程师光工资就得一千亿。所以,在这个里面看上去,这个数字首先大家觉得比较耸人听闻,但是实际上在政府行动纲要里面,部委内部是算过账的,最高的一笔帐达到3000亿。所以,这个数字实际上是比较准确的。
但是,我们在欢庆的同时,我们具体看一下,这到底是一千个亿的市场机遇还是一个代价高达一千亿的政府的痛点?当我们真正要去把一个政府的信息化系统打开的时候会碰见什么问题?首先,很容易算出来显性成本,如果直接把后台数据库打开风险太大,而且对于政府来说,那就意味着所有的数据不加保留的暴露在所有其他人的面前,我为什么要这样?第二,即便我们做好了这两个,这时候原系统的开发商可能不在了,即这样可能给你开发的这个系统团队也都早就没在了,这意味着要花大量的时间把原来的系统重新补一遍才能准确无误没有风险的把数据开放出来。第三,系统开发商的锁定问题。所以,这些可以证明我们算出来的数据。
更关键的是我们现在的数据,所谓政府很多的数据开放平台,更多是说先把数据搞出来再说,怎么用,没想出来,或者说画几个漂亮的数字。所以,如果想不清楚数据开放出来怎么用,其实它的阻力就很明显,怎么去协调这些数据利益的相关者,怎么协调原来信息系统的相关者。因为我根本讲不明白,把数据开放出来到底干什么?所以,整个的沟通成本,基本上形成了一个系统。真正到了这边的真正开工,基本上要花半年到一年的时间进行沟通、交流、论证。所以,这么一算下来,其实真的用传统方式去实现大数据行动纲要的三个时间节点我个人是持比较悲观的态度。