城市大数据的生态模型及应用

●决策服务平台:面向各级领导,通过图表方式呈现经济、民生等数据的分析结果。

●管理服务平台:面向政府工作人员,通过缩放地图、拉动时间线来查看其感兴趣的数据,如街道主任可以限定自己所处街道查看人口出生率,而同级教育主任可能更关心扫盲率。

3.3 获取数据

在城市大数据开发过程中,真正的困难是从获取数据开始的。从产业模型角度看,属于培育大数据生产者的工作。

首先,政府部门开发自己的数据意愿很低。这其中的原因非常多,包括政策上的顾虑、部门立场的考虑以及公开数据可能带来的种种问题和对变化的担忧。在这些因素里,数据安全是一个绕不开的话题。2015年刑法修正案在信息安全领域明确扩大了犯罪主体的适用范围,使得部门主要领导和相关负责人都不愿意承担因数据泄漏风险引发的连带责任。为了让政府部门的数据能够更有效地共享,除了技术上不断提高,加大数据保护的力度之外,在法律、制度上进一步细化和松绑已成为不可缺失的一环。商业上的创新也比较关键,比如考虑一种保险制度来解除大数据共享过程中所引发的安全责任风险。

其次,数据预处理(即把低级数据加工成高级数据)的工作量非常大。一方面,政府的系统建设过于分散,都是大量的小厂商开发出来的,数据规范性一开始就不高;另一方面,这些政府系统一开始没有考虑向大数据分析优化,缺失数据严重,而不同系统之间的数据一致性更加没有保障。这就要求厂商花出大量的时间进行数据查漏补缺,通过不同的数据源进行相互验证来获得更加完整、准确的数据集。在这个预处理过程中,本身也有一些大数据技术在其中应用,比如通过数据分析来判断哪些数据集准确性更高,从而替换其他重复数据。

另外,数据格式五花八门,有很原始的表格、文本数据,也有纸质数据,需要通过OCR扫描识别入库。