图:死亡人数统计:1965年,时任国防部长罗伯特·麦克纳马拉在五角大厦内向媒体通报越战战况。
大数据已经准备好要改变社会,从我们如何诊断疾病到教育孩子,甚至让汽车可以自动驾驶。
信息正在成为一种新的经济投入、至关重要的资源。企业、政府甚至个人都将测量和优化一切可以被测量和优化的东西。
但事情有不好的一面。大数据侵犯隐私,而当它被用来预测我们可能会做什么尚未做的事时,它也威胁到了自由。
大数据还让一个很老的问题持续恶化:依赖数字。尽管数字出错的几率比我们认为的要高得多,但没什么比罗伯特·麦克纳马拉的故事更能显现数据分析走上歧路的恶果。
麦克纳马拉精通和沉迷数字。1960年代初期越南形势开始紧张时,他被任命为美国国防部长。他坚持从任何可以获得数据的事物中获得数据。
他相信,只有运用严格的统计法,决策人员才可能理解复杂的形势,做出正确的选择。他眼中的世界是一大堆不受控制的信息的集合,如果这些信息被描述、注释、区分并量化,就可以被人类之手驯服,并以人类意愿行事。
麦克纳马拉寻求绝对真相,他认为这种真相能够在数据中找到。他拿到的数字之一是“死亡人数统计”.
麦克纳马拉毕业于哈佛商学院,24岁时成为该学院最年轻的助理教授。他在这个阶段发展了对数字的热爱。第二次世界大战中,他成为五角大厦精英团队“统计控制”的一员,把自己严谨的工作方式带到了这个团队,让这个世界上最大的官僚机构基于数字来做决策。
在这之前,军队是盲目的。比如说,它不知道备用飞机零件的型号、数量或地点。数据帮上了忙,仅仅是让军备采购更高效就在1943年节省了36亿美元。
现代战争要求资源高效配置,这个团队取得了令人惊叹的成功。
战争结束后,团队成员把他们的技能提供给美国大公司。福特汽车当时步履蹒跚,绝望的亨利·福特(Henry Ford II)把公司的生死大权交给了他们。这帮人在帮助赢得战争时对军事一无所知,此时他们对生产汽车也同样毫无概念。但这些被叫做“精明小子”(Whiz Kids)的人仍然让福特翻了身。
麦克纳马拉在福特汽车急速上位,对每个状况他都要求拿出数据来做参考或查核。工厂经理们对此不甚其烦,但还是拿出了他要求的数字——不管准确与否。
一个命令传达下来,规定一种车型的所有存货都必须用完才能开始生产新的车型。恼火的生产线经理们干脆把多余的零件扔到了附近的河里。当时在工厂里流传着这样的玩笑:可以在河面上行走——踩在1950年和1951年车型生锈的零件上。
麦克纳马拉是依赖数字而非感情的超理性执行官的典型。他可以把他的量化技能运用到所有可以运用的地方。1960年他被任命为福特总裁,不过他才干了几个礼拜,就被再三劝说加入总统肯尼迪的内阁担任国防部长。
随着越南紧张局势升级,美国派出了更多军队,一件事日渐清晰:这场战争关乎意愿而非领地。美国的策略是重击越共,逼其坐到谈判桌上来。为此,衡量战争进展的方法是被杀死的敌人数量。死亡人数统计每天都公布在报纸上。对于支持战争的人而言,它是进展的证据。对于批评人士而言,它是不道德的明证。死亡人数统计是一个时代的注脚。
麦克纳马拉依赖数据,崇拜数据。这个头发整齐向后梳、领带打得无可挑剔的人感到自己可以通过紧盯数字表格来理解战场上正在发生的事。这张表上有整齐的行、列、统计和图,这种掌控感似乎让他离上帝更近了一步。
1977年,最后一架直升机从美国驻西贡大使馆的屋顶起飞两年后,退役将军道格拉斯·金纳德(Douglas Kinnard)发表了一份名为“战争主管”的里程碑式调查,揭露出量化法的困境:只有2%的美国将军视死亡人数统计为衡量战事进展的有效方法。“伪造——全无价值。”一位将军在他的评论中写道。
“通常都是公然的谎言”,另一位将军写道。“许多军事单位大肆夸大这些数据,这主要是因为像麦克纳马拉这样的人对这些数字显示出难以置信的兴趣。”
在世界向着大数据时代迅猛挺进的今天,美军在越战中对数据的使用、滥用和误用给我们提供了一个有关信息局限性的让人不安的教训。我们基于的数据可能质量很差、有偏颇、被错误分析或误导使用。而更能招致恶果的是,数据可能抓不住它意图量化的东西。
我们易受“数据独裁”影响的程度可能超出了我们的想象。所谓数据独裁,是让数据统治我们,它带来的损害可能和好处同样多。
其中的危险在于,我们会让自己被分析成果盲目框住,即使有合理的理由怀疑某些东西出了错。
教育看来在衰退吗?那就推动标准化测试来衡量表现、惩罚教师或学校。想阻止恐怖主义?那就创造禁飞黑名单来维持空中治安。想减肥?买个应用程序来计算卡路里,而忘了实实在在的锻炼。
这种独裁甚至让其中最好的企业也跌入陷阱。谷歌根据数据运营一切事物。它的成功很大程度上是从这种策略而来,但它也时不时因此绊倒。
谷歌联合创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)长久以来都坚持要知道所有应聘者的SAT分数和大学GPA.在他们看来,第一个数字显现了潜力,第二个数字衡量了成就。那些40多岁、已经做出一番成绩的主管们仍然被不断催促提供这些成绩,这让他们极为困惑。即使初步研究显示这些分数与工作表现无甚关联,该公司长久以来还在继续要求这些数字。
谷歌应该更好地了解其员工,抵制数据虚假魅力的引诱。这种衡量方式没有考虑到一个人在其人生中可能发生的改变。它看重的是会读书的人,而非知识。它可能也无法反映出人文学科背景的员工的质素,因为人文学科相比科学或工程学更难量化知识技能。
谷歌在其人事操作上对这类数据的沉迷尤其令人不解,因为这家公司的创始人都是出自注重学习而非成绩的蒙台梭利学校。按谷歌的标准,比尔·盖茨、马克·朱克伯格或史蒂夫·乔布斯都不会被雇用,因为他们都没有大学学位。
谷歌对数据的顺从已经走到了极端。玛丽萨·迈耶(Marissa Mayer)在跳槽雅虎前是谷歌的高层主管之一,她曾在决定公司网站工具条的最佳颜色时,要求员工测试41种不同的蓝色,看看人们使用哪一种更多。2009年,谷歌的最高设计师道格拉斯·鲍曼(Douglas Bowman)气呼呼地辞职了,因为他受不了谷歌对任何事情都要做不断地量化。
“我最近和人们辩论一条边的宽度应该是3个、4个还是5个像素,我还被要求证明我的选择。我没法在这种环境里工作,”他在一篇宣布自己辞职的博客中写道。“当一家公司充斥着工程师时,它就会用工程学来解决问题。把每个决定都简化成简单的逻辑问题。数据最终成了每个决策的支柱,这让这家公司瘫痪。”
这就是对数据的独裁。这让人回想起,引导美国升级越战的思想方法是基于死亡人数统计而非更有意义的度量标准。“
毋庸置疑,不是每个可感知的复杂的人类情势都可以被完全地简化为一张图上的线条或一张表格上的百分比数字,或者财务报表上的数字。”麦克纳马拉在1967年的一次讲话中这样说道。当时美国国内的反战示威正日益激烈。“但是,”他接着说,“所有现实都可以被逻辑分析。而对于可以被量化的东西不做量化,就是满足于未达到完全理性的状态。”
如果正确的数据是以正确的方式被使用,而不是因为尊崇数据本身而使用,那就好了。
麦克纳马拉在1970年代继续运营世界银行,1980年代他把自己塑造成鸽派人士,直言不讳地抨击核武,支持环保。他在晚年(他于2009年去世,享年93岁)出了一本回忆录《回顾》(In Retrospect),批评了越战和自己任国防部长时所作决策的背后主导思想。“我们错了,错得可怕。”他写下了这句名言。
但是,他所指的是战争的广泛策略。在数据的问题和死亡人数统计这个具体环节上,他仍然没有悔意。他承认许多统计是“误导或错误的”.“但是对那些可以统计的事物你应该统计。死亡人数就是其一。”
大数据会成为一块基石,改良我们服用的药、我们的学习方式和个人行为。然而其中存在着风险:它杰出、强大的能力会引诱我们重蹈麦克纳马拉的覆辙:把自己钉在数据上,对它给予我们的能力和承诺如此沉迷,而忘了鉴别它固有的误导的能力。
作者:肯尼斯·库吉尔(Kenneth Cukier)是《经济学人》的数据编辑。维克托·迈耶·斯贡伯格(Viktor Mayer-Sch?nberger)是英国牛津网络学院的网络管理学教授。他们是《大数据:一场影响我们如何生活、工作、思考的革命》(Houghton Mifflin Harcourt 2013年出版)一书的作者。本文节选并改编自书中章节。