埃博拉病毒——大数据时代的疫情防控

HealthMap的官网宣称,他们主要的数据来源是 ProMED(一个国际传染病协会,成员主要为一线医生和研究人员)邮件列表、世界卫生组织官网,GeoSentinel(来自国际旅行医学协会和美国疾病预防控制中心的临床医生以个人身份的检测)、世界动物健康组织官网、联合国粮农组织、EuroSurveillance(欧洲地区以同行评审为目的的传染病监测和交流的信息平台)、Wildlife Data Integration Network(一个全球野生动物基本新闻源)、谷歌新闻搜索,百度新闻和搜搜资讯。另一份公开发表的论文显示,大部分数据来自ProMED (61. 58%),谷歌等其他搜索引擎新闻则贡献了25. 24%,除此之外比较重要的来源还包括 RSS 订阅(12. 11%), 推特等社交媒体(8. 7%)[5]。这和新闻中极力鼓吹的完全通过社交媒体预测埃博拉疫情,似乎还是有一定的差距。这个社交媒体并不是大众所以为的普通公开社交媒体,而是全球一线医护人员建立的社交网络。事实上,谷歌以及其他一些社交媒体都试图通过抓取网络关键词来监控和预测疾病信息,但是并没有取得如此好的效果。谷歌曾经宣称自己的系统很好地预测了美国每一季的流感爆发,而实际数据显示,他们的系统常常高估了患病率。普通人对疾病的感知和在社交网络的分享,的确不如实际病情那么准确。另一方面,推特的数据显示,埃博拉引起了美国用户前所未有的恐慌,各州的讨论数字一片飘红,网络极端言论层出不穷。但实际上美国至今也只有4个确诊案例和一个死亡案例。

来自以色列贝斯医疗中心的临床信息学专家Brad Crotty博士在接受采访时说,HealthMap事实上还有很多工作要做,以排除“背景噪音”。这位专家并不是这个组织的成员。

Crotty博士说:“你的确可以得到早期预警,但他们并不总是正确的。”

而正在负责HealthMap运营的Sumiko Mekaru博士则称,他们的本意是作为传统和官方健康报告的辅助,而不是取代它们。

二、疫情死亡率的计算与估计[6]

死亡率的计算十分重要,特别是对于传染性疾病。病死率在流行病学中是一个非常重要的估计指标,因为它告诉我们感染特定疾病后死亡的概率。如果正在爆发中的估算准确,甚至可以帮助我们确定病毒是否在危害性方面发生变异,以及研究最合适的治疗方案。

正在西非乃至全球 肆虐的埃博拉病毒,有着众所周知的高致死率。在以往 的爆发中,高达90%的被感染者死于埃博拉。和本次大爆发同宗的扎伊尔型埃博拉病毒以往平均死亡率为80%。这也是为什么,世界卫生组织最新疫情报告中的数据看起来有那么一丁点像好消息—— 尽管埃博拉感染率正在以惊人的速度攀升,报告中整体死亡率却只有53%,从塞拉利昂的39%到几内亚的64%。这比以往几次疫情爆发要相对温和一点。难道是这次爆发的病毒比以往的致死率与危害性低一点?还是说我们已经有了更有效的治疗方案?

实际上此处有一个隐情:明显降低的死亡率可能更多是因为官方测算方式的缘故,而非病毒的致死率,或者说患者接受的治疗水平导致的。事实上,最近几周感染人数的急剧增加,正是报告死亡率看起来不那么高的其中一个主要原因。

官方所谓的死亡率,或者说一个爆发疾病的“病死率”,有若干计算方式。其中最为简单的,就是目前死亡人数除以目前总感染人数。世界卫生组织最近报告的死亡率也就是这样计算的。

但是这种方法并没有考虑到,许多依然存活的病人——特别是刚刚被诊断又病得很厉害的——很可能也不能活下来。因此这低估了实际死亡率。特别是疾病在快速扩张时,这种低估效应会被加大。来自英国爱丁堡大学研究传染病的进化生物学家Andrew Rambaut认为,这种计算也忽视了那些被确诊为埃博拉感染者,却在被批准恢复并出院之前已经离开医院的患者的生死。许多这样的病人后来都死了,但是却没有被统计在官方死亡数据中。

另一种计算方式是只考虑已经确认恢复而不再需要治疗与已经死于疾病的患者,而不计入目前还在治疗中的病人。这样的结果看起来更为克制精确。根据11月5号塞拉利昂健康与卫生部最新疫情报告,841个确诊病人被治疗后出院了,而1,103个确诊病人已经过世。这样该地的埃博拉死亡率应该是57%,而非世界卫生组织报告的39%。不过来自哈佛公共卫生学院的流行病学专家Marc Lipsitch认为,这样的计算方式依然不够准确。治愈出院的病人通常比死于病症的病人,要在医院待更长的时间。也就是说不计入计算的还在治疗中的病人,实际上是更可能治愈的那批。因此这样的计算会高估实际死亡率。