李开复:AlphaGo若打败了世界冠军,意味着什么?

创新工场董事长李开复在知乎就 AlphaGo 与李世石的人机大战发表了自己看法,他认为四个月前的 AlphaGo 击败李世石基本不可能,不过这四个月AlphaGo 进步很多,比赛应该很精彩。但是,无论这次结果如何,机器 1-2年 之内必然完胜人类。完胜人类之后呢?可以做个通用的大脑吗?意味着机器可以思考了吗?还有什么问题是机器无法超越人类的?

以下为李开复就 “AlphaGo 能战胜李世石吗?” 在知乎的回答原文:

先直接回答这个问题,下面再分析 AlphaGo 和人工智能的未来。我认为 AlphaGo 这次的比赛打败李世石比较悬,但是 1-2年 之内必然完胜人类。

按照两者的 Elo (围棋等级分),可以算出去年年 底的 AlphaGo 打败李世石的概率相当低。如何算出的呢?AlphaGo 去年年 底的顶级分布式版本的 Elo 是 3168 (见下面第一张图),而李世石的 Elo 大约是 3532 (全球围棋手 Elo: Go Ratings ,见下面第二张图)。

李开复:AlphaGo 若打败了世界冠军,意味着什么? 李开复:AlphaGo 若打败了世界冠军,意味着什么?

按照这两个等级分的两个棋手对弈,李世石每盘的胜算为 89%(李开复:AlphaGo 若打败了世界冠军,意味着什么? ,公式见:How to Guide: Converting Elo Differences To Winning Probabilities : chess链接地址:https://www.reddit.com/r/chess/comments/2y6ezm/how_to_guide_converting_elo_differences_to/ 温馨提示:访问此链接需复制粘贴至浏览器打开,下同)。如果对弈一盘,AlphaGo 尚有 11%的获胜的可能性,而整个比赛五盘胜出三盘或更多,AlphaGo 就只有 1.1%的可能性了。(当然,按照原来的 10月 的 AlphaGo,只有 1.1%,不过现在既然大大进步了,就不一样了,也许今天已经超越了:见下面第三点)。

AlphaGo 不是打败了欧洲冠军吗?有些人认为 AlphaGo 去年底击败了欧洲冠军樊麾,所以挑战 (前) 世界冠军应有希望。但是,樊麾只是职业二段 (Elo 3000 左右),而李世石是职业九段 (ELO 3532)。这两位的差别是巨大的,完全不能混为一谈。就比如说一个人乒乓球打败了非洲冠军,并不代表他就可以成功挑战中国冠军。

AlphaGo 有可能在这几个月突飞猛进,进而击败李世石吗?AlphaGo 的负责人说:” 外界不知道我们这几个月进步了非常多 “。(来自:http://www.geekwire.com/2016/alphago-lee-sedol-whos-underdog-in-google-ai-million-go-match/)。这点确实有可能。AlphaGo 进步的方法有两个:(1) 增加硬件:我们从 Nature 的文章可以看到:从 1202 个 CPU 到 1920 个 CPU,AlphaGo 的 ELO 只增加了 28,而且线性地增加 CPU,不会看到线性的 ELO 成长。若要达到 364 ELO 积分的提升,需要的 CPU 将达到天文数字 (有篇文章估计至少要 10 万个 CPU:http://www.milesbrundage.com/blog-posts/alphago-and-ai-progress)。当然,谷歌有钱有机器,但是纯粹加机器将会碰到并行计算互相协调的瓶颈 (就是说假设有十万万台机器,它们的总计算能力很强,但是彼此的协调将成为瓶颈)。在几个月之内增加两个数量级的 CPU 并调节算法,降低瓶颈,应该不容易。(2) 增加学习功能:AlphaGo 有两种学习功能,第一种是根据高手棋谱的学习,第二种是自我对弈,自我学习。前者已经使用了 16 万次高手比赛,而后者也在巨大机组上训练了 8 天。这方面肯定会有进步,但是要超越世界冠军可能不容易。最后,换一种分析方式:如果从过去深蓝击败世界冠军的 “成长过程” 来看,深蓝大约 1993年 达到职业大师水平,4年 后才在一场六盘的比赛中击败世界冠军 (大约 500Elo 积分点的提升)。今天的 AlphaGo 应该和 1993年 的深蓝相似,刚进入职业大师水平。若要击败世界冠军,虽然未必需要 4年 的时间,但是几个月似乎不够。

还有什么以上未考虑的因素,导致 AlphaGo 获胜吗?如果谷歌刻意未出全力和樊麾对抗,或者有其它学习或并行计算方面超越了 Nature 里面的描述,那 AlphaGo 完全有可能获胜。

(有最新的消息:李世石预计自己会大胜,不是 5﹣0 就是 4﹣1,他的目标是达到 5:0,一盘都不输。AlphaGo 负责人认为有 50%概率可以战胜李世石,因为最近四个月进步非常大。)

既然写了这么多,就对这个题目再发表一些看法:

AlphaGo 是什么?在今年一月的 Nature (http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html ) 有 AlphaGo 的详细介绍,AlphaGo 是一套为了围棋优化的设计周密的深度学习引擎,使用了神经网路加上 MCTS (Monte Carlo tree search),并且用上了巨大的谷歌云计算资源,结合 CPU+GPU,加上从高手棋谱和自我学习的功能。这套系统比以前的围棋系统提高了接近 1000 分的 Elo,从业余 5 段提升到可以击败职业 2 段的水平,超越了前人对围棋领域的预测,更达到了人工智能领域的重大里程碑。

AlphaGo 是科学的创新突破吗?AlphaGo 是一套设计精密的卓越工程,也达到了历史性的业界里程碑,不过 Nature 文章中并没有新的 “发明”,AlphaGo 的特点在于:不同机器学习技术的整合 (例如:reinforcement learning, deep neural network, policy+value network, MCTS 的整合可谓创新)、棋谱学习和自我学习的整合、相对非常可扩张的 architecture (让其充分利用谷歌的计算资源)、CPU+GPU 并行发挥优势的整合。这套 “工程” 不但有世界顶级的机器学习技术,也有非常高效的代码,并且充分发挥了谷歌世界最宏伟的计算资源 (不仅仅是比赛使用,训练 AlphaGo 时也同样关键)。

AlphaGo 的跳跃式成长来自几个因素:1) 15-20 名世界顶级的计算机科学家和机器学习专家 (这是围棋领域从未有的豪华团队:也许你觉得这不算什么,但是要考虑到这类专家的稀缺性),2) 前面一点提到的技术、创新、整合和优化。3) 全世界最浩大的谷歌后台计算平台,供给团队使用,4) 整合 CPU+GPU 的计算能力。

AlphaGo 是个通用的大脑,可以用在任何领域吗?AlphaGo 里面的深度学习、神经网络、MCTS,和 AlphaGo 的扩张能力计算能力都是通用的技术。AlphaGo 的成功也验证了这些技术的可扩展性。但是,AlphaGo 其实做了相当多的围棋领域的优化;除了上述的系统调整整合之外,里面甚至还有人工设定和调节的一些参数。AlphaGo 的团队在 Nature 上也说:AlphaGo 不是完全自我对弈 end-to-end 的学习 (如之前同一个团队做 Atari AI,用 end-to-end,没有任何人工干预学习打电动游戏)。如果 AlphaGo 今天要进入一个新的应用领域,用 AlphaGo 的底层技术和 AlphaGo 的团队,应该可以更快更有效地开发出解决方案。这也就是 AlphaGo 真正优于深蓝的地方。但是上述的开发也要相当的时间,并且要世界上非常稀缺的深度计算科学家 (现在年待遇行情已达 250 万美金)。所以,AlphaGo 还不能算是一个通用技术平台,不是一个工程师可以经过调动 API 可以使用的,而且还距离比较远。

如果这次 AlphaGo 没有打败李世石,那还要多久呢?IBM 深蓝从进入大师级别到比赛击败世界冠军花了四年。AlphaGo 应该会比深蓝更快提升自己,因为深蓝需要新版本的硬件,和针对 Kasparov 的人工调节优化,而 AlphaGo 是基于谷歌的硬件计算平台,和相对通用的深度学习算法。所以,几个月太短,4年 太长,就预计 1-2年 之间吧。

从国际象棋到围棋,到底是不是巨大的突破呢?肯定是的,在这篇文章里面 (在国际象棋领域,电脑已经可以战胜人脑,那么围棋领域电脑还差多远?链接:https://www.zhihu.com/question/21714457 ),第一位回答者分析了围棋的复杂度为 而国际象棋则只有 。在 1997年 深蓝击败世界冠军时,大家都认为:深蓝使用的是人工调整的评估函数,而且是用特殊设计的硬件和” 暴力 “的搜索 (brute-force) 地征服了国际象棋级别的复杂度,但是围棋是不能靠穷举的,因为它的搜索太广 (每步的选择有几百而非几十) 也太深 (一盘棋有几百步而非几十步)。而 AlphaGo 的发展让我们看到了,过去二十年的发展,机器学习 + 并行计算 + 海量数据是可以克服这些数字上的挑战的,至少足以超越最顶尖的人类。

AlphaGo 若打败了世界冠军,就意味着计算机超越人脑?或者可以思考了吗?

我的回答:

在可以凭逻辑分析推算的问题上,机器即将远远把人类抛在后面。机器速度会越来越快,学习能力会越来越强,数据会越来越多。当年,大家讨论 “国际象棋输给机器不算什么,围棋才是真正的智慧” 只是我们人类维护自己尊严但是不实际的幻想!今天,我们该面对现实了!

在大数据 + 机器学习 + 大规模并行计算的时代,我们将看到无数的商机和产品,能够在预测、分析、推荐等方面,产生巨大的商业和用户价值。不过,这些解决方案和人类相比,其实没有什么意义,因为人差太远了 (比如说:推荐引擎将能推荐你最可能会买的产品、想吃的菜,想认识的人;自动交易能得到更高的投资回报和风险比例……)。

在感知方面,人类也将会被机器超越。今天的语音识别,人脸识别,未来的自动驾驶,都是例子。

但是,对于那些科幻片的粉丝们:以上都还是冷冰冰的技术,机器人是否会人性化?这还是未知的。毕竟,在情感、喜怒哀乐、七情六欲、人文艺术、美和爱、价值观等方面,机器离人还差的很远,甚至连基础都没有。对人工智能的研究者,这是下一个挑战。对我们人类,在下个突破之前,我们还是多发展右脑吧!

P.S. - 也许有人好奇,为什么这个话题我说了这么多,因为在 1986年,我在读书时,曾经开发了一套黑白棋系统 (复杂度),击败了黑白棋的世界团体冠军,而当年的那套系统也有 (非常粗浅的) 自我学习的能力。有兴趣的网友可以在这里看到我当年的文章:A pattern classification approach to evaluation function learning (链接:http://www.sciencedirect.com/science/article/pii/0004370288900768) 。

原创文章,作者:创新工场,出处:http://36kr.com/p/5044292.html