谷歌程序战胜围棋冠军 并非计算机打败了人类

依据个人的理解,我曾将围棋的思维过程分解为四步的演进:常识→棋感→计算→判断。

大约一年前,我曾和李喆七段就此问题进行过简单讨论,当时我认为蒙特卡洛算法的成功主要在于为人工智能建立了“棋感”,而以往的人工智能只能在“常识”和“计算”具有天然优势。

在蒙特卡洛算法之前,虽然计算机凭借强大的计算力可以积累大量“常识”,但由于“棋感”的缺失,人工智能无法对计算方向进行有效的筛选,最终就不免沦于蛮力搜索。

而蛮力搜索虽然可以在一定程度上实现高水平的“计算”,甚至很多其他棋类都在这一环节上被人工智能打败,而由于围棋的过度复杂和摩尔定律结束对计算机发展前景的限制,走到这一步仍然无法让人工智能战胜人类。

谷歌程序战胜围棋冠军 并非计算机打败了人类

(注:上图为计算机眼中的国际象棋落子思路,而下图为计算机眼中的围棋落子思路,来自谷歌deepmind官网AlphaGo | Google DeepMind)

谷歌程序战胜围棋冠军 并非计算机打败了人类

而蒙特卡洛算法出现后,凭借大量储备的棋局,通过胜负概率来判断下一步着点以作为计算方向,极大的提高的计算的效率,所以AI的水平才实现了革命性的进步。

而这次的AlphaGo,使用了深度神经网络与蒙特卡洛树状搜索相结合的方法。

依据已经能看到的Nature上的论文(可见雷锋网文章:《Google人工智能击败欧洲围棋冠军, AlphaGo 究竟是怎么做到的?》),研究者们在AlphaGo中加入了两个深度神经网络,以value networks来评估大量的选点,而以policy networks来选择落子,并且开发了一种新式算法来结合蒙特卡洛算法和以上两个神经网络。

谷歌程序战胜围棋冠军 并非计算机打败了人类

(注:上图为AlphaGo使用的神经网络结构示意图,来自原论文)

在这种结合下,研究者们结合参考人类职业对局的监督式学习,和AI大量积累自对弈实现的深度学习,来训练和提高AI的围棋实力。

在蒙特卡洛算法之后,我看到了新的天地。这种结合以及新式的思路,让人感到前景无限。

最后谈一谈,我认为我们应该保有的态度。

如何面对人工智能?

这里,我首先想引用李喆七段在今天早上说的话:

“我们已来到两个时代的连接处,无论你是否愿意,这都是一个需要接受的事实。工具无善恶,善恶在人心。未来的路通往何方,将由我们自己决定。”

从凌晨到早上,朋友圈里的评论区一直争论不休,甚至某世界冠军一直在说“不信”,毕竟大家在没有看到板上的钉子之前,从情感上都是不愿意相信的。直到另外两位一线棋手告诉他,已经可以看到棋谱了......

面对这个事件,接下来将会有很多的爆炸性新闻报道,以及各种各样姿势的讨论。

我们要知道:

一.人工智能的确实现了很大的进步。

这次的进步可能是革命性的,这次新闻宣称的AI取得的成绩并不是“标题党”。

二.人工智能还没有战胜人类(什么所谓“人类最后的骄傲陷落”都属于“标题党”)。

但朝着这个方向迈出了一大步,而且是在很多人在蒙特卡洛之后不看好AI下一步发展的情况下,来了一个突然袭击(谷歌从开始研究到出成果再到发布,一直憋一个大新闻憋这么久也真是能忍)。

三.人工智能战胜人类的时点,可能比很多人想象的要来得更早了。

不是之前设想的生物计算机或者量子计算机出现后,甚至都不是新材料取代硅晶片之后,在这个时代就有可能出现了。也许是五十年后,也许是二十年后,甚至可能是十年后。