北京大学黄罡:政府大数据开放共享的挑战和机遇

所以,经过我们大半年实际在这个产业里面的应用,我们统计发现这将近200个工程,实施效率基本提高100倍,最高能达到几千倍,它的成倍基本上节省90%以上。所以,我们认为它的核心就是因为我们把传统的以这种开放数据为粗放式的方式变成了一种精细的方式。那么,我们认为如果全部政府数据行动纲要,如果此前用传统的方式我们需要一千个亿,用我们燕云只需要一百个亿,这是我们认为对国家的一个重大贡献。这是浏览器系统,其实我们APP也可以打破,很多CS系统也可以打破。因为对我们而言,不管浏览器也好、手机也好,里面其实都是经典的软件。所以说,我们是从软件的角度看大数据最重要的信息孤岛。

我们做的从整个大数据来说是很小的一个点,我就是把信息孤岛给搭配,一打破以后能干什么呢?我们刚才看到能干很多事情。而我们北大干什么?第一,我们会持续完善我们数据开放的能力。其次,我们已经做了一套超轻量级的数据处理平台,这个数据处理平台,基本上从理念和整个使用场景上,跟阿里云前一阵发布的数加是基本一样的。但是我们最大的特点是,阿里云是基于它的一套大数据处理,至少要十个节点才能跑起来,但是我想问,现在不管是政府也好,所有厂商也好,现在你们手里的数据除了从网上的扒的有多少超过1T的。我们一个节点就可以了。我们燕云处理的数据就是API流进来的,但是原始数据还是政府的,大家说怎么可以这样?我可以告诉大家,阿里云对于淘宝大数据的处理就是这样,每个商家自己的电商数据全是淘宝可以免费用,但是你要处理不能拿出去给别人。

最后我们的一个理念就是我们认为我们不仅解决了百亿级的政府数据开放问题,更主要的是把政府数据源源不断安全可控的拿出来放到社会上,我相信整个社会都会存在在这个完全中国特色万亿级的大数据时代。谢谢大家!