Mehanna所说的“机器学习平台”,是将人工智能从上个世纪的“寒冬”变为现在蓬勃发展的模仿人类大脑行为的范式应用。在广告领域,Facebook需要的是一个人类工作无法实现的系统:对广告点击人数的即时预测。Candela和他的团队要基于机器学习的方法创造出这个新系统。并且,因为他们想要将这个系统建成一个平台,他们的模型和训练必须具有一般性和可复制性。
建立机器学习平台的一个重要因素是高质量数据的获取,越多越好。幸运的是,这正是Facebook一项最大的资产:当超过十亿人每天与Facebook的产品互动时,它可以为他们的训练收集大量数据,并且当他们开始测试时,会有取之不尽的用户行为样本。这使得广告团队进展很快,从每几周推出一个新模型到每周推出一个新模型。另外,因为系统最终会成建成一个平台,公司内部会使用平台来设计自己的产品,Candela设计了一个多团队同时工作的方法——一个简洁的三步过程:“首先关注绩效,接着是效用,最后建立一个社区”。
Candela的广告团队已经证明了机器学习可以为Facebook带来多大的变革力量。他说:“我们在预测广告点击率上取得了巨大成功,就像是一次大转变。”所以将这个方法扩展到更大的服务中是很自然的事情。事实上,FAIR的领导LeCun已经在争取建立一个伙伴团队,将人工智能应用在公司产品中,将机器学习的方法更广泛地应用在公司运营中。LeCun说:“我正在为此努力,因为我们需要高素质的工程师,虽然他们不直接与产品打交道,但产品团队却需要他们提供技术基矗”
2015年10月,Candela成为了新的AML团队主管(在一段时间内,他还同时兼任着广告团队的负责人)。他与FAIR团队保持着密切的联系。虽然FAIR在纽约、巴黎和门洛帕克市都有办公地,但实际上他们的成员就坐在AML工程师旁边。
他们合作的方式可以用一个正在运行中的产品来说明,该产品是Facebook上对照片进行语音描述功能。过去的5年中,训练系统识别屏幕中的物体并给出一般性结论(比如照片是在室内还是室外拍摄)已经成为了人工智能训练的普遍标准。但是最近,FAIR的科学家们发现了一个方法,可以训练神经网络在图像中变出每一个物体并判断他们之间的位置和关系,进而理解整个图像的含义,比如分析出图中人们正在拥抱,或者有人正在骑马。LeCun说:“我们将这个方法展示给AML团队,他们思考了一会儿,说‘在一种情形下,这项技术会非常有用’。”于是,一个帮助盲人或视力低下的人“阅读”图片的功能原型出现了。Candela谈到他的姐妹团队:“我们一直在交流。更大的挑战是将科学技术转化成产品,这需要粘合剂,而我们就是这个粘合剂。”
Candela将人工智能的应用分为四个部分:视觉、语言、谈话和照相机特效。他认为这四个部分会产生一个“理解内容的机器”。通过研究如何明白内容的含义,Facebook可以从评论中、话语的细微变化中探查隐含的意思,在视频中识别出你朋友一闪而过的面孔,在你真实的会话中解译你的表达。
Candela说:“我们正在使人工智能一般化。在内容激增的今天,我们需要理解和分析内容,否则我们贴标签的能力就会跟不时代了。”而解决方法就在于建立一个普遍性的系统,使得一个项目的工作可以为相关项目的工作提供帮助。他说:“如果我能将其他项目的成果转移来构建我自己的算法,岂不是非常棒?” 这样的转变让Facebook产品上新的速度飞速提升。拿Instagram举例:最开始的时候,用户展示的照片是按照时间顺序反向排序的。但是在2016年初,公司决定使用算法将照片按照相关性来排列。好消息是因为AML已经完成了类似于News Feed动态信息流中的机器学习部分,所以“他们不用从抓取数据开始做起“,Candela说,“他们有一两个熟悉机器学习的工程师负责联系其他运作排序类应用的团队,所以他们可以直接复制那些团队的工作流程,出现问题的时候也可以去询问他们。”于是,Instagram在几个月内就完成了这个划时代的转变。