中国IDC圈4月18日报道,在Deepmind和AlphaGo获得的巨大成功吸引了全世界的目光的同时,新一代人工智能德大战已经开始。
Deepmind之前开发的玩雅达利(Atari)街机游戏的人工智能是全新一代的智能技术——大数据驱动通用人工智能(Big Data-driven Artificial General Intelligence)。
就像这个名字所提到的,这里有两个重要的因素,一是“大数据”驱动,二是通用人工智能。大数据驱动的机器学习使得机器尽量脱离人类的经验指导,自动在海量数据和工作环境中挖掘知识取得进步。而通用人工智能基于端对端(end-to-end)的深度强化学习(Deep Reinforcement Learning),帮助机器能在不同的任务中共享一套学习框架,无需人类进一步调试。
这两个因素同时作用出一个效果,即人需要的干预越来越少,而机器在与环境交互反馈中的自主学习比重越来越大。
“大数据”驱动的机器学习
AlphaGo的围棋棋力来自于30万张人类对弈棋谱以及3千万次自我对弈,这是一个典型的大数据机器学习产物。
相比之下,1996年击败国际象棋大师卡斯帕罗夫的IBM深蓝(Deep Blue)人工智能,其依赖的是大量人类总结出来的走子规则的手动输入,以及基于超级计算机每秒上亿次搜索的全宽度(full-width)搜索解决方案。
简单地说,深蓝的人工智能相当于人类把自己下象棋的知识和经验手动输入电脑中,而AlphaGo的人工智能是人类把一堆棋谱“丢”给电脑,后者自己学习总结出来甚至进一步超出人类围棋认知范畴的知识。
基于机器学习来搭建人工智能,人类不需要通过显示地编程来教机器如何工作,而是给出一个学习框架,告诉机器如何根据自身当前设置以及提取环境的反馈去进一步更新参数,进而达到一个更好的工作表现。
然后人类只需要把大量数据“喂”进机器,机器就可以不断学习不断优化自身的参数了。这样,人类就不需要自己首先去总结经验再交给机器,而是变成了“甩手掌柜”,在一边看着机器学习起来就行。
随着机器学习的模型先进性以及机器处理大数据的能力不断升级,基于大数据的人工智能已经在人们的生活当中扮演越来越重要的角色。
过去10年间,基于大数据的人工智能已经在各个领域展露头角,包括在线广告的精准投放、搜索引擎个性化网页排序、电商的个性化商品推荐、社交网络的好友建议、人脸识别、图像识别、自然语言理解、机器翻译、语音识别、无人机跟踪技术、汽车自动驾驶等等。
很明显,未来的10年内,越来越多的应用场景会装配上人工智能,而且机器会不断学习,做得越来越好。
通用人工智能
Deepmind和其它做机器学习的科技公司的不同在于它提出来的通用人工智能(Artificial General Intelligence)的概念和产品。通用人工智能背后的技术是深度强化学习,其主要有两个特点,一是端对端(end-to-end)的学习,二是自适应, 无需人类调参而胜任不同的任务。
Deepmind之前推出的玩街机游戏的通用人工智能技术就完美地诠释了这两个特点。
首先,机器的输入直接是游戏屏幕的像素,不需要任何特征设计和编码。这里要归功于最近4年来名声大噪的深度学习技术。深度学习通过建立较深层数的人工神经网络模型,使机器能够自动从原始输入信息中提取、学习出适用于预测、决策的高层特征。
例如在人脸识别这一场景中,深度卷积网络(deep convolutional networks)输入层得到图片像素本身,底层网络学习出点、直线、曲线、拐角等初级特征,中层网络在这些点、线、角的基础上学习出眼睛、鼻子、嘴等器官特征,高层网络则进一步组合这些器官特征判断出图片是否包含人脸。
其次,同样设置的机器可以做不同的任务,只要“喂”进去的数据不同,无需人类调参或者只需要极小的人类工作花销。Deepmind使用同一个深度Q学习网络(DQN,deep-q-network)模型可以玩不同的街机游戏,只需要让机器玩某个游戏几天,它就能学会并超过人类玩家。
通用人工智能可以理解为是在强化学习的框架下,结合其在不同任务下的适应性、模型零耦合(model-free)的优势和深度学习的特征自动提取的优势,实现出的能胜任多种任务端对端学习的超级人工智能。这已经十分接近人类学习和工作的方式了。
正是由于以上两点优势,人类在开发新一代人工智能的过程中需要做的干涉越来越少,交给机器去自动完善的学习比重越来越大,这为人工智能的工作水平的提升以及在各个领域的普及带来了本质的飞跃。