书评人 胡澈
著名的科幻小说《三体》讲述了这样的剧情:整个宇宙中有许多人类尚未了解的文明,直到一位地球人与三体人进行了通讯。至此之后,三体文明开始了解地球文明,并试图用“心理崩溃”的方式控制科学家,实现阻止地球文明进步的野心——如果当时三体文明中产生巴拉巴西,复杂网络研究的权威,也许就不用费尽周折,便能知道如何洞察地球人的行为。
在巴拉巴西(Albert-L szl Barab si)的新书《爆发:大数据时代预见未来的新思维》中,他试图回答了这样一个问题:人类的行为是否可以被预测?这位美国物理学院的院士巧妙地把历史和数学结合起来,有趣地回答了这一问题:
“在人类漫长的历史中,人类的行为并不是随机的,并不是泊松分布的,而是存在一定的规则。通过对大数据的分析,可以看到人类的行为规则是基于优先级排布的问题。每个人都有自己的任务列表,而如何按照优先级排列顺序则产生了不同的影响。”
换句话说,当你有紧急的事情,需要联系一个人的时候,你认为如何联系对方可以最好地实现你的目标?电话、短信、微博或者是微信?在巴拉巴西的眼里,想要预测对方的行为,最好的方式就是判断各种任务对于他的优先级,挑选最高的那一项即可。因为人类会不自觉地列出一个优先级列表,并在一段时间内优先完成最需要完成的任务。
这看似简单,却不是作者的梦呓,在《爆发》一书中,巴拉巴西像个历史小说家,道出一段段历史情节,层层递进,让人深陷其中,一口气“爆发”着读完此书。
全书逻辑缜密,并在每一篇的开头都以一个历史故事开篇,形象生动地描述着人类行为“爆发”现象的前因后果,并指出人类行为不是按照泊松分布,而是幂律——而人类行为在幂律分布中呈现出一种“爆发”的现象。
读完这本书后,我第一反应是三体的故事,第二反应则是计算机科学家杰伦·拉尼尔(Jaron Lanier)对于后Web2.0时代描绘的一种场景:互联网巨头掌握着数据和“云”,将群体的智慧吸收,并影响着群体。随着大数据时代的来临,越来越多的数据被掌握在互联网巨头之中。如果真的可以通过大数据进行分析和挖掘,每一位用户的行为都有可能被掌握。
人工智能之父阿兰·图灵曾提出一种判断机器人的原则:
被测试的有一个人,另一个是声称自己有人类智力的机器。测试人与被测试人是分开的,测试人只有通过一些装置向被测试人问一些问题,如果测试人能够正确地分出谁是人谁是机器,那机器就没有通过图灵测试,如果测试人没有分出谁是机器谁是人,那这个机器就具有人类智能。
这就是著名的图灵测试。
假设巴拉巴西的理论可以结合大数据运用于此,人工智能机器通过获取测试人的行为分布数据,在快速运算下,是否可以通过图灵测试?
我认为是可能的,虽然机器在语义方面的理解依然处于一个研究阶段,但用户“爆发”行为的分析可以提供一种精确的方法去模仿人类——在此方面,国内的互联网巨头已经积极开始行动。
虽然听起来似乎恐惧,但就我个人来看,我们应该乐观。因为人类仅仅有意识地分享出了一部分的信息。在后续发展中,人们积极地分享自身的数据亦有其好处——比如心脏突发类疾病、肥胖症等疾病可以有效地预判。
不管如何,巴拉巴西向我们展示了一种新的世界观。在大数据时代来临之际,我们可以更好地利用数据引导自身的发展,积极地利用“爆发”的幂律帮助自己更好地生活。