人机大战5个误区:人类没那么差阿尔法狗不会防水

曾在线上快棋中取得对人类围棋职业高手60:0战绩的新版“阿尔法狗”,昨天又在慢棋比赛中战胜了当今世界围棋“第一人”柯洁。人工智能到底有多强大?围棋已经被“攻克”了吗?人类还有希望吗?

5月24日,澎湃新闻特约撰稿人、人工智能和大数据专家郑宇就上述问题展开讲解:

原标题:走出人机大战五个误区:人类没那么差,阿尔法狗不会故意输棋

行至这一局面,柯洁连续抓头发25秒,引现场讲解一阵吐槽

5月23日,AlphaGo2.0版本在人机围棋比赛中以四分之一子的微弱优势战胜了柯洁,一方面继续彰显了人工智能的强大,但也让人们对AlphaGo和人工智能有了新的认识。

先说出结论,再看分析:

1.在围棋这个项目上AlphaGo目前走在了人类的前面,但并没有完全攻克围棋这项运动。它只是通过深度学习找到了一个比人类认识更优的解,但不是最优解。最优解无法找到,即便用尽地球上所有的资源。从专业的角度来讲,就是用深度学习去逼近了一个强化学习中的价值判断函数,然后再跟蒙特卡洛搜索树结合的方法(具体详解可参看《郑宇:一张图解ALphaGo原理及弱点》,不再重复)。既然人工智能和人类都不能找到最优解,现在说哪一方已经完全彻底的失败还早。

2. 人类也是在进步的,我们也不要低估了人类后天的快速(小样本)学习能力,这点AlphaGo基于现在的学习方法还做不到。短期来看人获胜概率小,但长远来看(未来5-10年)人还有机会,因为人也有很强的学习能力,可以从少量跟AlphaGo的对弈的棋局中快速学习。而即便再给AlphaGo1亿副棋谱,再添加一万块GPU,如果还是基于现有的学习体系,它进步的速度也终将放缓,因为新增的棋谱和计算资源相对于2x10171这个搜索空间来说只是沧海一粟。我们对人脑的了解还远不如对围棋的认识,这里面还有很大的未知数。

柯洁开局下出两手“三·3”,已然颠覆至少二十年来的围棋棋理(截自围棋社交App“弈客”)

(但实际上,柯洁这样下并不是心血来潮,他在各种职业比赛中已多次用这样的招数与其他职业高手“过招”。最近的中国“围甲”职业比赛中,各种“狗招”<阿尔法狗的招数>也已层出不穷,大家都在以自己的理解尝试人工智能下出的招数。而柯洁等职业棋手的“喂招拆招”,也是中国自己的围棋人工智能“绝艺”快速成长的重要因素。)

事实上,这一招柯洁已在对人类的对局中尝试多次(截自围棋社交App“弈客”)

现就读北大哲学系的“学者型棋手”李喆,也尝试多种新招(截自围棋社交App“弈客”)

3. 目前人类职业棋手跟AlphaGo的差距也就在一个贴目的水平,没有大家想象的那么大。其实这个贴目的差距(按中国标准7目半),在职业棋手看来,已经是非常大的差距了。很多职业高手,进入官子阶段后发现自己还落后对方7-8目,就会主动投子认输了。很多通过数子来决定胜负的比赛,输赢往往都在1-2目之间(比如柯洁就输给AlphaGo半目)。否则会被其他专业棋手笑话,自己落后那么多都不知道,点空能力太弱了。

要能真正客观、准确的看待这个问题急需要较强的人工智能专业知识,也需要一定的围棋功底。下面先纠正网上认知的一些误区:

误区一:AlphaGo可以让人类顶尖棋手4个子,AlphaGo2.0可以让上一个版本4-5个子。

要消除这个误解,首先要跟大家普及一下围棋知识:在围棋里“让对方两个子”和“赢对方2个子”有着天壤之别。这点对于下围棋的人不用多说,但我今天才意识到,很多吃瓜群众一直以为这就是一回事。难怪网上会流传以上的错误言论。