揭秘Facebook的AI机器:AI已关乎存亡

对于“机器学习平台”,梅汉纳是说在基于大脑运作方式的模型普及后,那个将AI带出上世纪的寒冬期进入近年的绽放时期的范例的普及。以广告为例,Facebook需要它的系统做某种没有人能够做的事情:即时且准确地预测有多少人会点击给定的广告。于是坎德拉和他的团队着手打造一个基于机器学习程序的新系统。由于该团队想要将该系统打造成平台,让该部门所有的工程师都可以访问,他们采取了一种让建模和训练能够推广和复制的建造方式。

打造机器学习系统的一大重要因素是获得优质数据——越多越好。幸运的是,这是Facebook最大的资产之一:当你有超过10亿人每天使用你的产品,你就可以给你的训练集收集大量的数据,一旦开始测试你也可以获得无数用户行为方面的例子。正因为此,广告团队能够加快到每周推出几个模型,而不再是每几周推出一个新模型。由于要将系统做成平台——让公司内部其他的人员也能够用来开发他们自己的产品——坎德拉得联手数个团队来展开工作。这是一个精细的分三步走的过程。“你要先专注于性能,再专注于效用,然后专注于打造社区。”他说道。

坎德拉的广告团队证明了机器学习技术在Facebook的变革性。“我们在预测点击、点赞、转换等方面变得极为成功。”他说。将那种模式扩展到Facebook平台的其它服务也就成了顺理成章的事情。事实上,FAIR领导者乐昆之前就在呼吁设立部门来负责将AI应用到产品当中——准确来说,是在公司内部更大范围地推广机器学习技术。“我的确曾呼吁设立这样的部门,因为你需要这样由优秀工程师人才组成的组织专注于可为很多产品部门使用的基础技术,而不是直接负责产品。”乐昆表示。

2015年10月,坎德拉成为新AML团队的主管(有一段时间,出于谨慎起见,他保留他在广告部门的职位,在两个职位之间穿梭)。他与FAIR保持紧密的联系。FAIR在纽约市、巴黎和门洛帕克均设有办事处,在门洛帕克它的研究人员实际上就在AML工程师的旁边工作。

AML和FAIR之间的协作,从一个给用户分享的照片提供语音描述的研发中的产品可见一斑。在过去的几年里,训练系统识别场景中的物品或者做出一般性的结论,如照片是在室内还是室外拍的,已经成为了标准的AI惯例。但最近,FAIR的科学家找到方法来训练神经网络描述图像中几乎所有的有趣物体,然后根据物体的位置和相对其它物体的位置来判断照片是关于什么的——实际上是通过分析姿势来判断特定照片里人们是在拥抱,还是在骑马。“我们给AML部门展示了这项技术,”乐昆说,“他们想了想,说,‘在这种情境中,那个技术会很有用。’”最终他们做出了一项可造福盲人或者视觉障碍着的功能原型,用户指向图像,就能让他们的手机通过语音给他们描述图像的内容。

“我们一直都在沟通,”坎德拉如是说到他的兄弟团队,“总的来说,要从科学技术发展到实际的项目,你需要粘合剂对吧?我们就是粘合剂。”

AI的四个应用领域

坎德拉将AI的应用分成四个领域:视觉、语言、语音和摄像效果。他表示,所有的这些东西将会带来“内容理解引擎。”通过研究如何理解平台内容的意思,Facebook想要从评论中检测出微妙的意图,从口语中提取出细微的东西,鉴别你在视频中快速出现的朋友的面孔,解读你的表情,然后将它们反映在你在虚拟现实场景中的化身。

“我们在研究AI的普遍化。”坎德拉说,“随着内容的爆炸性增长,我们需要提升理解和分析能力。”解决方案就在于打造普遍化的系统,使得一个项目的成功能够积累起来,让其它研究相关项目的团队能够受益。坎德拉称,“如果我能够打造出可将知识从一项任务转移到另一项的算法,那会很美妙,是吧?”

那种知识转移能够大大加快Facebook推出产品的速度。以Instagram为例。自上线以来,该照片分享服务就以时间倒序的形式来显示用户的照片。但2016年年初,它决定使用算法来按照相关性将照片排序。坎德拉指出,好消息是,由于AML已经在像动态消息(News Feed)这样的产品中实施过机器学习技术,“Instagram不必从头开始做。”他还说,“他们让一两个精通机器学习的工程师联系部分其它在运行某种内容排序应用的团队。然后,你可以直接将工作流程复制过来,有什么问题就问对方。”正因为此,Instagram短短几个月就能够实施这一重大变动。