大数据在未来会如何改变我们的生活?在《迷失》制片人J.J.Abrams和Bryan Burk打造的新剧《疑犯追踪》中,强大的计算机集群将整个纽约市的摄像头整合在一起,结合每个人的信用卡记录,医疗及社会保险记录,行车罚单等各种数据,推断并锁定出危害别人或即将被害的自然人。
这部创造了CBS电视台试播集历史收视最高记录的电视剧讲述了大数据在未来的一种可能性,影片中每隔几分钟就会出现监控摄像头拼接的画面,让整个故事更具真实性。就在数年前,斯皮尔伯格导演的讲述类似故事的大片《少数派报告》里,根据种种预兆来预判罪犯身份的工作还是由浸泡在水槽里的特殊人类来完成。从超人类到超级计算机的更迭,这是好莱坞对信息产业近年来飞速发展的肯定。
用大数据解构人类社会
在影视剧之外,IT厂商也已经开始试图用各类数据分析人类社会,由EMC、思科、FedEx、VMware等企业赞助的“大数据人类面孔”的就是一个用数据解构人类的项目,他们与这个项目的发起人、美国知名摄影记者瑞克.斯莫兰(Rick Smolan)一起开发了一款App“生命中的一天”,在全球范围内找到200多万试用者,搜集不同地区不同种族人群的生活习惯和各类数据。
只要开启这款App,用户就会被动搜集像是每天的行进里程与速度如何,在工作区域与生活区域的时间分割等内容。在搜集人们的大量资讯之后,将有助于了解大众对于家庭、信任、安全、睡眠、两性关系与约会等议题的看法,同时参与者也能够比较自己和来自世界各地的人们的答案,也可借此观察出不同地区、种族的人们的价值观和生活风格。
这是一个庞大的难以言喻的项目,在EMC高级副总裁李纳德(Steve Leonard)看来,大数据对市民的生活会带来真正的变革:学习、沟通、政府治理等等,可以将TB级的海量信息,通过成千上万的数据源搜集起来,可以通过分析得到新的结论,然后回馈改造社会。
未来大数据的商业逻辑
李纳德的想法中隐藏着一个简单的商业逻辑:从社会获取足够的信息,分析归类再将发现的问题反馈回社会。然后在这个过程中,EMC们凭借存储与数据分析的工作分享社会改进所带来的红利。
这是一个巨大的市场,Gartner在近期的报告中预测,今年大数据对全球IT开支的直接或间接推动将达960亿美元;到2016年,这一数字预计将达到2320亿美元。
众多的IT企业在进军大数据时最经常遇到的障碍就是针对不同人群不同行业时的专业壁垒,一个最有效的办法是收购,而以人类及社会为对象的数据分析,更是一种巨大的考验。在EMC的演示环节中,依靠Twitter的数据接口,EMC可以迅速的分析出Twitter上不同年龄段,不同地域,不同性别的用户对奥巴马和罗姆尼的提及次数,但却无法分析出Twitter上每个提及奥巴马的人对其支持与否,可见目前的技术距离成功仍有很大距离。
障碍与隐忧
事实上,技术并不是大数据的未来发展的唯一障碍,李纳德在“大数据中的人类面貌”开幕讲演中喊到,“我们要做的第一件事,就是打破大数据是“老大哥”(Big Brother)的想法。大数据可以用于社会进步。大数据可用于健康,可用于跟食品有关的事情。尽管大数据同样可用于安全方面,但是,我们不能认为大数据就是“老大哥””。
“老大哥”是谁?没错,就是乔治·奥威尔在小说《1984》中窥伺一切的“老大哥”(Big Brother),大数据对个人信息的无限汲取,正如老大哥让自由主义者害怕。如何说服怀疑者?
EMC的官方回答是:“我们的演示都是基于Twitter的,事实上,EMC本身并不能获取足够的信息,这需要其他人的帮助,Twitter上的公开信息都是非保密性的,并不用担心”。
在本文开头的美剧《疑犯追踪》中,监控系统的发明者将信息封装成为黑盒,不给过程,只提供危险者的社会保险号码。但在现实生活中,基于隐私的利益链条如此庞大,又有多少人能够守住底线呢?在技术发展到能够足够的高度之前,有关大数据的争论仍会无休无止的进行下去,但有一点毫无疑问,真正视图抓住未来的公司,都不会放弃这样的机遇。