ImageNet的结果显示了深度学习的能力。突然间,深度学习就获得了关注——不只是在人工智能界,而是在整个科技产业界内!深度学习系统因此变得更加的强大:20或30层的网络变得很常见,微软的研究人员曾建立过152层的网络。更深层的网络能进行更高水平的抽象并产生更好的结果,事实证明这些网络擅长解决众多领域的难题。
“让人们激动的是这一领域的一种学习方法:深度学习,能够应用于众多不同的领域,”谷歌机器智能研究部门负责人、如今负责搜索引擎的John Giannandrea表示,谷歌正在使用深度学习提升其网页搜索结果的质量、理解智能手机端的口语指令、帮助人们在他们的照片中搜索特定的图片、推荐电子邮件的自动回复、改善网页的翻译服务,并且帮助它们的自动驾驶汽车理解周围环境。
学习如何学习
深度学习有很多不同的方式。最普遍使用的是“监督学习(supervised learning)”,这项技术能使用标记样本集训练系统。例如,过滤垃圾邮件:收集出邮件信息样本的大数据集,每一个都标上“垃圾邮件”或者“非垃圾邮件”。一个深度学习系统能够使用这些数据集进行训练,重复的进行样本训练进而调整神经网络内的权重,提高评定垃圾邮件的准确率。这一方法的巨大优点是不需要人类专家写出规则列表,也不需要程序员用代码编写这些规则,系统能直接从有标签的数据中进行学习。
使用有标签数据训练系统也被用于图片分类、语音识别、信用卡交易欺诈侦测、垃圾和恶意软件识别以及广告定位,所有这些应用领域中的正确答案都可通过之前的大量案例获得。Facebook 能在你上传一张照片后识别、标记照片里你的朋友和家人,它们近期还发布了一个能够为盲人描述照片中的内容(比如两个人、微笑、太阳眼镜、户外、水等)的系统。有大量的数据可用于监督学习,吴恩达先生说,这一科技的应用已经使现在的金融服务领域、计算安全领域和销售领域的公司将自己重新标记为了人工智能公司。
另一项技术是无监督学习(unsupervised learning),其通过将网络暴露在大量样本中来对网络进行训练,但不会告诉它要寻求什么模式。相反,该网络学习识别相似样本的特征和聚类,从而揭示数据中的隐藏分组、连接和模式。
无监督学习能在你不知道会是什么样的情况下被用于事物搜索:例如,监控网络中反常的通信模式,那可能代表着网络攻击;或检查大量的保险声明以检测新类型的诈骗方式。一个经典的案例:2011年当吴恩达在谷歌工作时,他领导的一个名为谷歌大脑(GoogleBrain)项目中的一个大型的无监督学习系统本是用于在千部无标记 YouTube 视频中发现共同模式。一天,吴恩达的一个博士生给了他一个惊喜。吴恩达回忆说“我记得他把我叫道他的电脑前说,‘看这个’”,电脑屏幕上是一个毛茸茸的面孔,从数千的样本中发现的模式。系统发现了猫。
强化学习位于监督学习和无监督学习之间,它涉及到训练一个神经网络与只以奖励作为偶然的反馈的环境进行交互。本质上,训练涉及到调整网络的权重,从而获得能带来更高奖励的搜索策略。DeepMind是这个领域的专家。2015年2月,它们在Nature上发表的一篇论文描述了一个能够学习玩49种经典的Atari视频游戏的强化学习系统,它只使用屏幕上的像素和游戏分数作为输入,输出则连接到一个虚拟的控制器上。这个系统从头学起玩游戏,最终在其中29种游戏中达到或超过了人类水平。
把系统游戏化
电子游戏是人工智能研究的理想训练场,DeepMind的Demis Hassabis说,因为“它们是真实世界的缩影,但更纯净和约束化。” 游戏引擎也可以轻松生成大量训练数据。Hassabis 先生以前从事过电子游戏行业的工作,后来取得了认知神经学的博士学位并创立了DeepMind。这家公司现位于伦敦国王十字车站附近,相当于谷歌的人工智能研究分部。
今年三月,AlphaGo于首尔的五轮比赛中打败了世界顶尖围棋选手李世石,作为开发公司的DeepMind因此登上头条。AlphaGo是一个有着独特特性的强化学习系统。它由几个相互连通的模块组成,包括两个深度神经网络,它们各有所长——像人脑中模块一样。其中一个通过大量的棋局分析训练提出一些可能的走法,另一个网络则负责根据随机采样技术来评估这些走法。这个系统把生物启发的技术与纯机器化的技术结合了起来。人工智能研究者们就哪种技术更优越这个问题已经争论了几十年,而AlphaGo却另辟蹊径两者都用。“这是一个复合型系统,因为我们认为解决智能问题只有深度学习是不够的”,Hassabis说。