能不能有一种方式去解决我们在政府打破信息孤岛实现数据开放领域的时间、空间成本。软件确实在大数据时代依然是非常重要的,为什么?所谓信息孤岛就是软件带,只不过因为我们做的系统软件太好了,90%以上的代码功能已经被我们系统软件给实现了,这个时候其实从我们做软件的角度来看,其实我要去理解这个信息孤岛非常简单,因为90%的东西我都是知道的,只是不知道由应用开发商写的不到10%的代码,而且那10%的代码往往是遵循我们定义的开发框架,比如MES,或者BS,或者CS。所以,基本上我们经过大量的实验发现其实我可以开发一套非常智能的软件的自动分析的工具和技术,给我任何一个系统,只要你在我的平台上操作一下,我基本上能够猜的八九不离十。因此,我们就可以自动的把这些系统生成一大堆的接口,把这些内部数据给开放。
整个思路很简单,把以前网络化的体系变成开放的自适应的体系。这个确实是非常有挑战,我们最后做的效果是什么?现在我们也有一个产业化的公司,在我们的左边是一大堆的信息孤岛式的地方政府的各种系统,它完全对我们来说是黑的,什么都不提供,我唯一知道的就是我有一个合法的用户账号,我这个用户账号可以看看他的报表什么东西。这时候我们的平台能够通过这个账号,把你所有的数据,这个账号能看到的所有数据,能写的所有数据,能够把它都分析出来。但是,对于原系统而言,我们这个燕云大数据平台就是一个合法的、正常的,你可以认为我们是一个小机型。我们可以快速的实现数据开放领域的三个核心能力。第一个就是数据的开放,第二个是快速的优化,第三个就是数据的流转。有了这些以后,我们认为在今天的政府信息化,或者政府大数据主要可以应用于惠民工程,应约于新型智慧城市。
讲了这么多,基本上通过给大家介绍一些具体的案例。目前我们这套技术已经推出了将近有半年了。目前已经在22个省市的189个各种各样的政府和央企系统里面,我们把它的数据都给接口化,然后拿出来了,基本上覆盖典型的一些政府部门,包括北京、还有成都这些。
简单举几个例子,首先我们给农业部门一个垂直系统,目前全国有500多个农产品的批发价格,这些价格是实时更新的,而且是农产品市场自己定的。用我们的燕云,你告诉我们是哪500个,然后我们把网站全部API化,我们首先解决500个人的应用系统我们能够快速的给你开放出来,当然前提是你有合法的账号。第二,另外一个是关于郑州市的,郑州市就是我前面讲的,他们要做一个部级系统,这个时候原来的系统厂商拒绝开放性,实际上后来我们调研发现,原来它的团队早就散了。所以,我怎么接你的系统,大家说不接了,所以直接去燕云。用了我们以后,对我们来说,根本不用你的后台数据库,根本不用你后来的源码,只要有一个合法算法,有一个合理界面,就可以直接把用户需要的数据全给拿出来。我们可以非常轻松的解决掉开发商锁定的问题,所以这个在政府大数据时代是非常关键的,因为数据其实是我们政府的,不是你系统开发商的,凭什么因为技术锁定的原因把我们锁定了。我想这个应该能够对我们地方大数据具体的实施带来极大的效益。
第三,这就是数据流转。我们给深圳平山做的,它其实就是要做一件事,因为我们在昨天刚刚发布的“互联网+政务”的行动纲要,这是一站式的,要花大量时间跟各个部门去谈,现在不需要了,我们快速把它的数据出来以后,可以写到其他地方去,因为一站式一定是把这个填了以后,同时数据可以输入到多个其他系统,或者中间数据来回流转。所以,这个里面除了实现数据的独特性,爬虫是做不到这一点的。同时,我们还按照深圳平山的要求,因为它已经流转起来,数据从我这儿出来以后,流转到那里,安全性是增强的。
这个是给神州数码做的惠民工程,以前的做法是一个一个单位,一个一个部门去交流,然后跟那些开发商去谈,基本上一个智慧城市落地一年以上。但是,利用我们现在基本上一个礼拜落地,非常快。当然这里面我们又做了另外一个事情,也是刚才大家很关心的一个,就是数据出去以后怎么办?那么,我们现在因为它同样是这个问题。当政府数据出来以后,除了政府的网站以外我们又有了神州数码一个新的智慧城市的一个出口。那么,这时候到底是谁在用我们的数据,或者查询接口,到底他是怎么用的,这些东西我们都提供了一套相应的管理的监控平台。首先,你们可以看到,到底我每一个接口,这个接口就代表数据,到底每天有多少人访问,或者每个小时有多少人访问,这个数据的流量是什么,流到哪些IP地址,或者流到哪些省市,甚至它在哪个应用里面。我不能做到数据确权,但是从燕云流的数据至少知道它的第一站是谁。我们是一个更加闭环的保护方式。