大名鼎鼎的AlphaGo Zero想必大家都知道,而最近它的研发团队DeepMind发表了新论文,提出了全新的强化学习算法AlphaZero,它将在多种任务上达到超越人类的水平。
AlphaZero的开发团队DeepMind
AlphaZero与AlphaGo Zero相比,不仅只是少了“Go”这么简单,具体来说,它将能够做到8个小时训练击败李世石版本AlphaGo,12小时训练击败世界顶级的国际象棋程序 Stockfish,14小时训练击败世界顶级将棋程序Elmo,即使是强大的AlphaGo Zero也已不是它的对手,在接受34小时训练后,即可战胜受训72小时的AlphaGo Zero,这种强大的自我学习能力堪称恐怖。
学习能力统计
如今,机器学习能力已越来越强大,不知职业棋手们的心理阴影面积会有多大,从中也可以预见的事,未来在部分领域人工智能将取代人类已板上钉钉。