接着,在上个月,DeepMind又占领了《自然》封面——在短期内获得如此成就非常惊人。这一次,它变本加厉的挑战上世纪70和80年代的复古游戏。围棋在中国有着超过2500年的历史,曾经出现在孔夫子笔下。围棋的分支系数非常大:每一颗棋子可能的走法数量超过了整个宇宙的原子数量,而且不像国际象棋,它无法用蛮力计算来得出结果。更加困难的是,想要写出围棋的评估函数是一件不可能的事,例如能够体现出谁处于优势位置以及优势多少的一套规则。反而,它取决于棋手的一些类似于“直觉”的东西:当被问到为何这样落子的时候,大师们通常的回答是“感觉如此”。
很显然,计算机在做出这方面的判断时会表现很糟,围棋也因此被认为是人工智能领域“悬而未决的重大挑战”之一,大部分研究者预期还需要十年机器才能有希望破解它。
DeepMind的新算法有着严格的同行评审证据,AlphaGo在去年秋季秘密的一场对决中以5:0击败了曾三次获得欧洲冠军的樊麾,并将在今年三月与世界冠军李世石对决。“令人瞠目结舌的进步”,帝国理工学院认知机器人学教授Murray Shanahan如此形容。“一个了不起的里程碑”,超人类主义哲学家Nick Bostrom也表示同意,后者写出的《 Superintelligence: Paths, Dangers, Strategies 》指出:如果通用人工智能可以出现,这将是一个无法比肩的事件——借用下谷歌工程主管Ray Kurzweil的话:这将是一次撕裂历史的断层。Bostrom告诉我在他牛津人类未来研究所的办公室中,AlphaGo的成就被认为“将过去几年间机器学习所取得的进步生动的表现了出来”。
“这非常酷。”Hassabis很平淡的说到,我们在他的办公室讨论着最新的胜利。像平常一样,他穿着没有任何特点的黑色上衣、裤子和鞋子:实在难以想象这实习生装扮的家伙拿到了谷歌的8000万英镑。“围棋是一个终极目标:它是一个游戏的巅峰,有着最丰富的智力深度。它如此迷人与美丽,令我们感到兴奋不仅在于我们掌握了这个游戏,还在于我们还用漂亮的算法完成了它。”围棋游戏更像是艺术而非科学,他认为:“AlphaGo以十分人类的方式下围棋,因为它是以人类的方式进行学习,通过不停地游戏变得更加聪明,就像你我一样。”Hassabis也许看起来像个学生,但他更像一个骄傲的家长,AlphaGo是他职业生涯中所达到的最令人激动的成就。“比任何人所想象的都高了一个数量级,”他有些激动,“但对于我们来说,最好的在于这不是一个使用人工规则的专家系统。它借助于通用机器学习技术教会了自己如何掌握游戏。最终,我们想将这些技术用于重要的真实世界的问题,例如气候模型或者复杂的疾病分析,对吧?想想它下一步能够解决的问题真的非常令人激动!”
气候建模,复杂疾病分析——开始想象下一步可能解决什么让人非常兴奋。——Demis Hassabis
我与Hasssabis的首次相遇是在2014年夏天,那是DeepMind被收购的几个月后。自那以后,我观察过他在各种不同坏境中工作,过去八个月中我也为这篇文章在三个不同场合正式采访过他。那段时间我看着他从一位谷歌的人工智能天才成长为了一位引人注目的传播者,他找到了一种高效的向类似于我这样的非科学家描述他非常复杂的工作的方法——对此他有极富感染力的热情——以及为什么这很重要。谦逊和日具风度,他非常擅长打破DeepMind的方法;也就是说他们结合新老人工智能技术的方式——比如说,在围棋中结合使用传统分析走子的“树搜索”方法与现代近似于大脑神经元网络的“深度神经网络”——而且他们还和人工智能研究的不同领域有条理清晰的“联姻”。
在DeepQ中,他们将深度神经网络与所有动物都有的通过大脑多巴胺驱动奖励机制的“强化学习”结合了起来。而在AlphaGo中,他们更进一步又增加了另一种更深度水平的强化学习以处理长期计划。接下来,他们将整合例如记忆功能等等——直到理论上达成每一个智能的里程牌。Hassabis说:“我们在存在多少这些能力的路线图上有一个想法。将所有这些不同领域结合起来是其中关键,因为我们对那些可以在一个领域内学习又能将知识应用到新领域的算法很感兴趣。”