搜集数据是否涉及隐私
一天早晨,警察冲进霍华德·马科斯的家,后者正打算用剪刀刺杀他的妻子,因为他发现妻子给他戴了绿帽子。警察开始控制霍华德,霍华德大喊冤枉:“我什么都没做啊!”这是电影《少数派报告》中的场景。不受限制的大数据分析可能也会导致这样的场景:罪责的判定是基于对个人未来行为的预测。
这场即将到来的数据革命,将给企业、国家的发展模式带来前所未有的革新与挑战,必须从战略高度来认识。美国总统科学技术顾问委员会主席霍尔德伦说,像美国历史上对超级计算和互联网的投资一样,大数据计划将对美国的创新、科研、教育和国防产生深远的影响。美国的每一项立法和计划,都有一个数据库和信息管理系统与之对应。2012年3月,美国宣布将投入2亿美元启动“大数据发展研究计划”,以推动大数据的提取、存储、分析、共享和可视化。通用电气也将投资15亿美元在旧金山建立一个全球软件和分析中心,拟雇佣科学家400名。如同工业革命要开放物质交易、流通一样,开放、流通的数据是时代趋势的需要。
但滥用大数据也会带来危险,当零星存在的数据被汇总,危机就出现了——不仅仅是隐私的泄露,还包括了被预知的可能性——这些能预测我们可能生病、拖欠还款和犯罪的算法会使我们无法购买医疗保险、无法贷款,甚至在实施犯罪前被预先逮捕。过于依赖数据,我们同样会受到局限:因为数据量过于庞大,做出决策的将是机器而不是人类。
《大数据时代》一书的译者、电子科技大学教授周涛提醒说,大数据也不是能解决所有问题的万能法宝。哈佛大学访问学者冯煦明指出:大数据之于传统经济统计,是补充,而非替代。基于抽样、调查、汇总等程序获得的数据仍将在经济分析和政策制定中发挥重要的作用。横向来看,传统统计方法在经济增长、税收、贸易、收入分配等领域的统计上具有主导优势,而大数据在物价、通货膨胀、失业率、消费等方面的统计上更具有优势。
总之,这本书以丰富的事例生动展现了大数据的光芒如何照亮整个世界,而严谨平实的叙述框架又令人了解到大数据各个技术性方面。对大数据的了解令我们对未来增添了憧憬和信心,难怪宽带资本董事长田溯宁称它是“我看到的最好的大数据著作”。