“AlphaGo采用的是蒙特卡罗树搜索框架,加上深度学习和深度强化学习。在这样一个框架下,深度学习尤其是深度强化学习在计算机围棋上的天花板究竟有多高,还是个未知数。”中国人工智能学会副理事长、清华大学计算机系教授马少平指出。
就仿佛科幻小说《三体》中,人类舰队首次迎战三体舰队“水滴”——去年3月,AlphaGo与李世石的围棋对决,让原本自信的人类,被不可预料的强大战斗力打了个措手不及。而与《三体》中人类舰队几乎全军覆没、残存舰队仓皇逃走所不同的是,李世石版人机大战还留下了一个悬念:人类围棋第一人柯洁,与AlphaGo战果如何?
如今,这个悬念将在今年5月于乌镇揭晓。
4月10日,中国围棋协会、浙江省体育局及谷歌共同宣布,三方将于5月23日至27日联合主办“中国乌镇·围棋峰会”(以下简称“围棋峰会”)。围棋峰会首日,柯洁与AlphaGo升级版的比赛将正式开打。该次比赛将采用中国规则的三番棋赛制,无论输赢均下满3盘,比赛每方3小时,5次1分钟读秒。
除此之外,主办方表示,围棋峰会期间还将举办配对赛和团队赛。在配对赛中,两位棋手将分别与AlphaGo组队,以此挑战棋手如何理解AlphaGo的独特风格并与之合作;在团队赛中,将由五位中国顶尖棋手合作,建立棋手“神经网络”与AlphaGo对决。
“我在半年前得知了与AlphaGo对决的消息,这次能够与AlphaGo对决,是我的荣幸。”在10日发布会现场,柯洁如是坦言。而对于一个“只有胜利才是唯一真谛”的棋手而言,柯洁表示“这一次不会轻易妥协”,并称“抱有必胜的心态和必死的信念”。
来自未来的对手
本次发布会就如AlphaGo一般神秘。在发布会前夕,谷歌仅对外通知10日下午将有“重磅消息”,直到10日上午9点之前,发布会地点仍是一个谜团。
即便如此神秘,也难掩内容本身的耀眼。早在数日之前,发布会的内容便不胫而走:业内传闻AlphaGo将与柯洁有一战,战期定档在5月下旬的乌镇。在10日发布会现场,主办方宣布这个巅峰对决的时间为5月23日。
赛事如此吸引眼球,原因在于这次的交战双方。
作为当今棋坛第一人,柯洁更像是人类获胜的最后一丝希望。他曾在一年前李世石0:2落后于AlphaGo之际放出豪言:AlphaGo要证明自己天下无敌,必须先过自己这一关,并称自己有信心战胜对手,“胜算大概在六七成”。
如今,在围棋峰会发布会现场,柯洁则显得更为谦虚,将AlphaGo描述为来自未来的对手。“现在的AlphaGo已经超过我们最强棋手的想象,带给我们最大的震撼与享受,”柯洁感慨道,“我是站在了历史变革的节点之上,很幸运能够见证AlphaGo这样强大的棋手。”
作为人工智能代表,全新版本AlphaGo相较一年之前更加强大,这也成为本次赛事的另一大看点。据介绍,新版AlphaGo采用了新的机器学习技术,能够通过训练形成策略网络,将棋盘上的局势作为输入信息,并对所有可行的落子位置生成概率分布,然后训练出价值网络进行预测,以对手的绝对胜利到AlphaGo的绝对胜利为标准,预测所有可行落子位置的结果。
而AlphaGo的真正优势体现在,将策略网络和价值网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,将监督学习和强化学习结合起来。此外,新版AlphaGo还将产生大量自我对弈棋局,通过自身为下一版本提供训练数据。
“蒙特卡罗树搜索的算法是让AlphaGo不停地自我对弈,”一位业内观察人士表示,“通过自我对弈,进而训练价值网络和策略网络,从而优化蒙特卡罗树搜索。”
换言之,击败李世石的AlphaGo 1.0,是通过学习大量人类对战棋谱及与多位人类顶级高手交锋,不断积累形成棋力的。本次迎战的AlphaGo 2.0版本,则将完全摒弃人类棋谱,凭借自我对弈成长为顶级高手。