我们能从谷歌流感趋势预测的失败中学到什么?

大数据并不是万能的,我们能从谷歌流感趋势预测的失败中学到什么?

比如,谷歌的算法很容易受到与流感无关的周期性的词汇所影响,比如“高中篮球”等。每天都有上百万的与CDC的数据相关的搜索词汇,其中的许多搜索都会与流感趋势紧密相关,但其中也会存在着很多与流感相关的搜索实际上并不是又真正的流感病例引起或者与流感趋势有关。谷歌也没有把搜索时间产生的搜索行为的不同考虑在内。在引入GFT后,谷歌还引进了参照性的搜索特征以及大量与医疗健康相关的附件来帮助用户更快的找到他们所需要的信息。虽然这对用户来说非常有用,让他们可以更好的利用搜索引擎,也使得一些搜索词汇更为普遍,更利于GFT系统的追踪。

把大数据的功能运用于公共利益显然与谷歌本身是有很大不同的,毕竟谷歌需要更多的信任感,因为他需要经常对用户的数据进行“窥探”。用户的数据之所以存在是由于个人用户和公司之间双重的影响,而相关的法律术语则经常是十分模糊的(又有多少人会仔细的阅读相关的专业术语和法律条件呢?)。而交易真正能够达成的原因是用户获得了服务,而企业则获得了相关的数据。

而公共利益则是接下来才会被考虑的。而企业和消费者实际上都是广义的社会的一部分,而对这些大数据进行解读显然能够让我们大家都获得好处。正如谷歌CEO埃里克•施密特(Eric Schmidt)所说:“我们必须牢记的是科技一直都只是人类的一项工具。”而关键在于,我们,以及这些科技巨头们如何利用大数据来造福人类的。

谷歌在流感预测方面的尝试可能能够成为企业利用大数据造福社会的一个好的模式。谷歌已经把与流感相关的搜索数据开放给了CDC遗迹一些研究机构。关键的问题在于谷歌接下来是否会与这些研究机构一起来改进GFT。未来的版本也许可以更新数据追踪的方式以实现更精准的流感趋势预测,而数据流本身的价值则将会逐渐减退。