Yann LeCun:FB对围棋的研究和DeepMind差很多

Facebook人工智能研究部门(FAIR)负责人Yann LeCun

钱童心

当今世界人工智能领域,有三位顶级专家被业内奉为“神一样的人物”,其中两位来自加拿大,一位来自法国。他们分别是加拿大多伦多大学的Geoffrey Hinton和蒙特利尔大学的终身教授Yoshua Bengio,以及Facebook人工智能研究部门(FAIR)负责人Yann LeCun(下称“LeCun”)——这位来自巴黎的学者目前担任纽约大学终身教授,他还是纽约大学数据科学中心的创始人。

Yann LeCun在今年3月走进中国的大学,在清华大学和上海纽约大学分别进行了两场人工智能的顶尖对话,并接受了第一财经记者的独家专访。

让机器拥有常识

LeCun是法国学界非常引以为豪的科学家,也是在美国科技巨头公司中担任要职的为数不多的法国人。虽然同为“极客”,但法国人独特的气质让LeCun和很多美国科学家相比,看起来更加随意、富有亲和力。

1987年LeCun从巴黎第六代大学的计算机系毕业后,就去了多伦多大学读博士后,师从“神经网络之父”GeoffreyHinton,Hinton也是将深度学习技术带入谷歌的人。博士后研究结束后,LeCun就一直工作生活在美国,先后任职于贝尔实验室、AT&T等大公司。2008年他创立了一家从事大数据挖掘的咨询公司YLC,直到目前,他还担任他所创立的另一家从事音乐制作和教育公司的首席科学官。

目前LeCun领导着Facebook人工智能研究部门近百人的团队。他的工作是推进人工智能的基础科学与技术研究;通过实验来发展人工智能技术在各个领域中的实际应用,如计算机视觉、人机对话系统、虚拟助手、语音识别和自然语言处理(NLP)等。

“人工智能的背后存在很多基础科学,它们也许并不面向应用,你的研究可能只是通向对智能和人工智能的理解。”LeCun对第一财经记者表示。

LeCun开辟了将神经网络运用于机器视觉的先例。五年前,其带领研究人员在图像识别的准确性上,取得了巨大的突破,这背后的技术——人工神经网络,促成了近年来人工智能的繁荣,也使得谷歌和Facebook得以让人们在自己的相册中使用搜索功能,并促成了一批使用面部识别的应用程序问世。

训练机器如何学习是LeCun的团队最重要的工作。过去很长一段时间,他们给机器“喂”了成千上万张图片,来教会机器区分诸如“汽车”和“小狗”。不过LeCun在这个过程中也抛出了新的问题:当有大量可用样本(比如桌椅、猫狗和人)时,训练机器没有问题;但如果机器从来没有见过这些实物,它还能识别出样本吗?

LeCun表示,人工智能发展的一大难题就是怎么样才能让机器掌握人类常识,这是让机器和人类自然互动的关键。想要做到这一点,它需要拥有一个内在模型,以具备预测的能力。LeCun用一个公式简洁地概括了这种人工智能系统:预测+规划=推理。而研究人员现在要做的,就是不需依赖人类训练,让机器学会自己构建这个内在模型。

“人们花了很多年来研究如何给图片和视频自动加入字幕或描述,从目前的技术来看,确实也已经出现了令人印象深刻的实现方式。”LeCun对第一财经记者表示,“但实际上,它们并没有看起来的那么令人惊艳,那些机器的专业上很大程度受限于人们训练它的环境。你如果向机器展现非常规的情况,大多数机器就会不知所措,因为它们不具备常识。”

LeCun认为,在机器视觉领域还有很大的进步空间,机器视觉的下一个突破将会是以自主观察世界的方式进行学习,比如通过观看视频来进行学习。这也意味着未来计算机可能会像婴儿学习那样掌握常识性的知识。

关于机器视觉如何与常识相联系,LeCun说,就连Facebook内部也有很大分歧。“一些人认为可以与智能系统只进行语言交流,但是语言是一个相当低带宽(lowbandwidth)的渠道,信息密度很低。语言之所以能承载很多信息,是因为人们拥有大量的背景知识,也就是常识,来帮助他们理解这些信息。”LeCun解释道。