“机器学习”的概念自上世纪50年代出来以来就备受科技界的关注,而近年来“深度学习”逐渐成为机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来识别图像、声音和文本等数据。
美国科技媒体《连线》杂志网络版日前发文对“机器深度学习”技术的最新进展进行了总结。以下是文章的主要内容。
在Quoc Le的眼中,世界都是由一系列的数字组成的。“一张数码照片实际上都是数字,”他说道,“如果将人们所说的话拆分成单独的音素,那么它们同样可以被编译成数字。”如果按照Quoc Le的说法,就可以将这些数字输入到机器之中,机器能够读懂照片和人们所说的话,比如Facebook能够识别出你的脸,谷歌则能够听懂你所说的话。
不过Quoc Le想要走得更远,他希望能够研究出一种能将整个句子、整个段落以及各种类型的自然语言转译成数字或其它载体的技术,借助这项技术,计算机科学家就可以让机器也能够获得人们看到和听到的信息。同时,Quoc Le还在探索如何让机器理解人们的观点和情绪的方法。
尽管此类技术目前尚处于起步阶段,未来还有很长的路要走,但相对于同行而言,Quoc Le要拥有更多供其调配的资源。Quoc Le是“谷歌大脑”(Google Brain)项目的一员,该项目主要从事“机器深度学习”领域的研究,这是人工智能的一种形式,主要用机器来模拟人脑进行数据处理。
现年32岁的Quoc Le一直在谷歌从事语音识别方面的工作,比如Android系统的语音识别功能以及为网络图片自动添加标签等,这两项工作都需要“深度学习”技术的支持。
除了谷歌之外,Facebook和微软等互联网巨头也都在使用“深度学习”方面的技术,同时百度公司最近也曾在公开场合谈及利用这项技术来为客户提供更为精确的广告推送服务。不过Quoc Le希望将该技术推向更为广阔的领域,包括对自然语言理解、机器人以及网络搜索等。
Quoc Le最近开发出了一项“深度学习”技术,能够鉴别出网络上不同的词汇之间是如何关联的,谷歌则在自己的“知识图谱”中融入这项技术,从而帮助其对搜索结果进行知识系统化,让每一个关键词都能获得完整的知识体系。
曾经的困扰
Quoc Le上世纪90年代首次接触到人工智能,但是确实让他感到烦恼不已,因为当时的机器学习系统非常依赖工程师的手工输入,尽管机器在一定程度上也具备理解能力,但是却需要比较繁琐的操作才能完成。比如当时的机器在照片没有添加标签的情况下就无法对其进行识别。
“我们对大量无标签的数据进行了学习研究,”Quoc Le说道,他曾与“谷歌大脑”项目的创始人之一吴恩达(Andrew Ng)在斯坦福大学共同研究人工智能,“如果未来我们能够找到一种可行的算法来让机器对无标签的数据进行识别,那将有可能会改变整个计算行业,毕竟现在网络的大部分数据(如Facebook、Twitter和谷歌)都是没有标签的。”
这也正是“深度学习”技术未来想要实现的目标。利用数万台电脑通过软件模拟人脑中的神经元网络,从而让机器获得与人类相似的学习能力,比如在某些情况下机器能够在无需对数据添加标签的情况下实现自动学习。
谷歌的猫脸识别其实就是“深度学习”技术的典型案例,只不过在经过了长达三年的研发之后,这个项目仍然没能获得大的进展。与此同时,大部分商业深度学习系统目前仍然比较依赖人工监控。“尽管猫脸识别技术的实用性很低,”吴恩达说道,“但是我认为这项技术代表是深度学习未来发展的一个方向。”
语言的挑战
“深度学习”技术需要面临的另一个挑战是对自然语言的识别。人类的语言中包含大量的微妙信息,迄今为止科学界还未能找到识别这些微妙信息的方法。比如一个相同的词汇,在不同的语境或语气下都会有不同的意思,目前大部分人工智能系统都无法区分这些信息。“机器非常善于处理数据,但是却无法应付语言符号,”Quoc Le介绍说,“因为语言是一种具备高度象征意义的东西。”
对语言进行识别的关键是找到将符号转译成数字的方式。“目前我们还没有找到将语言概念转变成机器能够处理的数学结构的方法,”Quoc Le说道,“不过在与Word2Vec工具的帮助下,我们在这方面也取得了一定进展。希望未来我们的机器能够自动识别发布在网络上的海量信息。”
“人们未来是不可能随时随地监督机器的学习的,”与Quoc Le一起在斯坦福大学攻读博士学位的理查德索切(Richard Socher)说道,“我们希望未来能够将监督学习和非监督学习结合起来,这样机器就能实现许多目前难以想象的事情。”
Quoc Le最近联合谷歌的几位同事发表了一篇关于在深度神经网络研究中使用机器翻译的文章,其中谈到了对“回归神经网络”的利用,据了解这可能是目前语言识别领域最为先进的技术。
更强大的“谷歌大脑”
Quoc Le在文章中表示,他们所发现的新方法要优于其它机器翻译算法,不过这也仅仅是“深度学习”的一个应用而已,未来“深度学习”技术还将会用于网络上的问题答疑、自动说明以及情感分析等等。
为了充分利用这些先进的算法,谷歌将不得扩充自己的“机器神经网络”规模,而不是局限在图像和语音的识别领域。“深度学习”概念的奠基人、目前供职于谷歌的杰夫·韩丁(Geoff Hinton)曾在介绍“谷歌大脑”项目时表示:“就像是鸽子的大脑一样,虽然它拥有良好的视力,但是任何人都不会与一只鸽子进行对话。”
实际上,即便是脑容量相当小的鸽子,其大脑的计算能力也能够轻松超越目前世界上最为先进的“机器神经网络”(包括“谷歌大脑”),而在韩丁加盟谷歌之后,更是宣称未来要帮助谷歌打造全球最大的“机器神经网络”来对“深度学习”进行更加全面的研究。
译者:小凯