“大数据”能力不仅是一种统计技术和数据分析能力,更考验着政府在信息上的开放和透明。
在令人恐惧的SARS事件过去10年后,令人不安的禽流感又来了。
最新报道:4月9日上海新增确诊2例人感染H7N9禽流感病例,浙江新增2例;全国共发现确诊病例28例,共8人死亡。一个好消息是,上海4岁感染H7N9禽流感男童康复;一个坏消息是,农业部称不排除更大范围检出H7N9禽流感。人们很习惯遗忘,政府尤其健忘,可现实逼着政府去反思SARS事件10年后自己在提升信息公开和改善突发事件应对上到底做了什么?
流感信息的发现、统计和发布,关键是数据的处理。这一次的禽流感,尤其考验着政府的“大数据”能力。
“大数据”是近来很流行的一个概念,是面对信息爆炸时代产生的海量数据,对这种庞大的数据资源的处理能力和统计技术。谁率先具备从各种各样类型的数据中快速获得有价值信息的能力,谁就是赢家。很有意思,关于大数据最闻名的故事,就与流感相关。舍恩伯格在《大数据时代》开篇中就讲了这个故事:2009年甲型H1N1这种结合了导致禽流感和猪流感的病毒出现时,全球的公共卫生机构都担心一场致命的流行病即将来袭,可各国疾病和预防中心在发现和统计流感信息方面又很滞后,因为人们在以为自己患了普通流感的情况下一般不会去医院,病重时才会去,医院才会搜集到这个信息,而且这种信息传到疾控中心也需时间,所以通告新流感病例时往往会有一两周的延迟。对于一种可能飞速传播的疾病,信息滞后两周的后果将是致命的。
而一家知名互联网公司的工程师发表的论文则让公共卫生官员们感到震惊,文章解释了这家公司为什么能够预测到冬季流感的传播:不仅是全美范围的传播,而且可以具体到特定的地区和州。这家公司是通过观察人们在网上的搜索记录来完成这个预测的。他们每天都会收到来自全球超过30亿条的搜索指令,他们希望通过分析人们的搜索记录来判断这些人是否患上了流感。他们不是简单地以“哪些是治疗咳嗽和发热的药物”之类检索词条来判断,而是通过检索词条的组合建立了一个数学模型。所以,这一年甲型H1N1流感爆发的时候,与习惯性滞后的官方数据相比,这家公司建立了一个更有效、更及时的指示标。
舍恩伯格是想通过这个故事说明,大数据深刻地改变了公共卫生,改变了人们的思维方式。当今天H7N9禽流感成为问题时,我们的政府部门有必要反省自身的“大数据能力”:政府有没有告别那种滞后的统计方式,有没有能力对海量数据进行有效的分析,从而让政府的判断走在疾病传播的前面,不仅能预测,更能在流感传播前进行有效的预防。
“大数据”能力不仅是一种统计技术和数据分析能力,更考验着政府在信息上的开放和透明。首先,政府能不能获得真数据?现在很多政府部门最缺乏的就是获得真数据的能力,层层虚报,层层造假,“知情权”被层层说谎的体制所剥夺,没有能力获得反映真实情况的数据信息,海量数据都是垃圾数据。然后,信息能不能自由流动?在一个信息被垄断和被操纵的空间中,信息是很不完整的,碎片化零散的信息自然难以进行大数据分析。最后,信息能不能透明公开?以“担心影响社会稳定”、“公开会引起恐慌”的理由封锁信息,那是最愚蠢的。