首先,就是数据的来源。高耗能企业的生产规模、排放量这些数据是否层层上报,准确统计?掌握此数据的部门是否能向社会公开?北京500万辆汽车所加汽油到底有哪些成分,产生的尾气对空气污染指数的“贡献”率到底多大?
目前似乎这些都还做不到。中共中央政治局常委、国务院副总理李克强在谈到北方地区大面积空气污染严重时,强调必须有所作为,同时公开、透明并及时向公众公开了PM2.5的数据,提醒公众有污染,损健康,要加强自我防护。要树立全民意识,需要全民参与,共同治理。
确实,从1月10日开始,北京出现持续重度污染天气之后,“环保北京”、“气象北京”、“北京环境监测”、“平安北京”等政府官方微博第一时间发布相关信息。虽然这些只是提示性的信息,也算走出了一小步。
不过,更进一步的信息,比如按照《北京市重污染日应急方案》,污染最严重的区县停驶30%公车,到底有多少公车停驶,相关部门都一直没能给出确切的数字。
大数据收集、挖掘、应用是技术问题,而数据公开与否就是态度问题了。
翻看着北京极重度污染几天中官方发布的各种干巴巴的污染指数,很羡慕《大数据》一书中的几个图表,一个是1850年代,南丁格尔这名英国的战地护士,在考察了在克里米亚战争中英国士兵死亡情况后,作出的简单图表,清晰地反映出“战斗死亡”和“非战斗死亡”的悬殊对比,由于医疗卫生条件恶劣导致死亡人数大大超出直接阵亡人数,这张图表直接促成了英国政府建立野战医院的决定。
还有一张出现在2010年2月1日《华盛顿邮报》上,当时,奥巴马宣布了联邦政府新的年度预算。《华盛顿邮报》利用可视化技术,制作了图表,用线条的粗细表明各项收支金额的大小,左右两列表示收支,钱从个人所得税、企业所得税、消费税还是遗产税来,向哪里去,是用于国防、社会保障、医疗还是债务利息支出,一目了然。
2012年2月,《纽约时报》又用“圈圈”对2013年联邦政府的预算进行了可视化展示。他们用圆形的大小表示金额的多少,颜色表示增减,绿色代表增加,红色代表缩减,变化额度越大,颜色越深。
这些直观的图表是大数据可视化的结果,如果想通过图表看出污染源在哪儿,停驶车辆有什么样的效果,还得耐心等待,因为我们目前第一步还没有迈出——数据公开。