彼时,一名年轻的法国人Yann Lecun花了10多年时间做一件事:模仿大脑的某些功能来打造人工智能机器。这件事在许多计算机科学家看来是一个坏主意,但Lecun的研究已经表明,这种做法可以造出智能而且真正有用的产品。
在贝尔实验室工作期间,他开发出了一些模拟神经元的软件,通过读取不同的例子来辨识手写文本。而贝尔实验室的母公司——AT&T,也用利用这门技术,开发出了第一台可以读取支票和书写笔迹的机器。对于Lecun和人工神经网络的信徒们来说,这似乎是一个新时代的开始,标志着机器可以学习以前仅属于人类的技能。
只是对于Lecun而言,这项成果取得成功之时也是这个项目走向尽头的时候。为了开拓不同的市场,AT&T宣布分拆成三家不同的公司。他们打算让 Lecun做一些其他的研究,于是他离职去了纽约大学任教职。与此同时,其他地方的研究人员也发现,他们无法把Lecun的突破应用于计算问题,随后人们对于将大脑模拟的方法应用于AI研究的热情也逐渐开始减退。
虽然对于现在已经55岁的Lecun而言,他从来没有停止探索人工智能的步伐。在被无情拒绝了20年有余后,Lecun等人终于在人脸和语音识别等领域取得了惊人的成就。如今在科技领域人尽皆知的深度学习,已经成为Google等科技公司新的战场,他们急不可耐地想将其应用于商业服务。Facebook在2013年聘用了Lecun,让其管理由50多人组成的人工智能研究团队——FAIR。对于Facebook而言,Lecun的团队是其第一笔基础研究投资,可能让公司从社交网络的定位中走出来,并且很可能会让我们对机器能做的事情有重新的认识。
雷锋网多次报道,Facebook等公司在近几年急不可耐地投身于这一领域,主要是因为在计算机识图等领域,深度学习技术比之前的AI技术要先进得多。在以前,研究人员需要编写大量的程序来赋予机器能力,例如侦测出图片中的线条和直角。但深度学习软件则能自己理解和利用数据,不需要借助这种程序。基于这一理论开发出的一些程序,精确度已经可以和人类相媲美。
现在Lecun在研究更加有力的东西,他打算赋予软件完成基础对话的语言能力和常识。在进行搜索时,我们可以直接告诉机器我们想要的是什么,就像和人交流一样,而不用小心思考要输入检索的内容。深度学习让机器拥有了理解和交流的能力,能辨明和回答问题并且给予我们建议。其应用之一就是可以理解我们的要求并代替我们预定餐馆,并且很有可能对游戏行业产生变革。
在Lecun看来,这些系统不仅要能帮人类完成任务,还需要知道为什么。现今的搜索引擎、反垃圾系统以及虚拟助手还做不到这一点,他们大多数只是通过关键词匹配等技术来完成任务,而忽略了词语出现的顺序。以Siri为例,它只是在几类应答库中搜索符合你所提要求的内容,但实际上它并不能理解你说的到底是什么意思。而像此前在 Jeopardy游戏中战胜了人类的IBM大型机Watson,则是通过高度程序化的规则来掌握语言能力,但其无法应用于其他情境。
相反地,深度学习的软件可以像人类一样掌握理解语言的能力。研究人员试图让机器拥有理解词汇的能力,Lecun等人开发出的系统,可以在阅读一些简单的故事后回答问题,进行逻辑推理等。
但是Lecun等人深知,人工智能领域总是雷声大雨点小,人们起初认为可能取得巨大的突破,到最后可能只是小小的一步。要想让机器处理复杂的语言问题可比图像识别要复杂得多,毫无疑问,深度学习在这一领域大有作为,但它们是否能真正掌握语言并改变我们的生活,还是一个未知数。
深度的历史
如果要追溯起来,深度学习的历史远早于Lecun在贝尔实验室的工作的年代,他和其他人实际上只是复活了一个长眠已久的想法。
时间回到20世纪50年代,为了探讨智力和学习是如何产生,以及信号在大脑的神经元之间是怎样传递的,生物学家们提出了一些简单的理论。其中核心的观点就是,如果细胞间总是频繁地交流,那么神经元间的联系会加强。在有新的经验产生时,这种传递会调整大脑的结构,以便在下一次经历相似的事情时让人产生更好地理解。