揭秘Facebook的AI机器:AI已关乎存亡

这也不是什么新鲜技术——苹果此前曾吹嘘有在iPhone上进行某种神经计算。但这对于Facebook来说难度要大得多,因为它无法掌控硬件本身。坎德拉说,他的团队能够执行这种任务,是因为部门工作的不断累积——每个项目的完成都让另一个项目变得更加简单,每个项目的建造,都让未来的工程师能够打造出需要更少训练的同类产品——因此像这样的项目能够快速打造出来。“从开始着手做这个到拿来出进行公开测试,我们只花了8个星期,很很疯狂。”他说。

坎德拉称,做像这样的任务的另一个秘诀是协作——Facebook文化的中流砥柱。在做该任务时,容易接洽Facebook其它的部门,尤其是非常熟悉iPhone硬件的移动团队,让他们能够跳过在Facebook的数据中心渲染图像的过程,从而直接在手机上执行该项工作。这带来的好处远不止是能够使得你的亲朋好友的影像变成《呐喊》(The Scream)风格。这是让整个Facebook变得更加强大的一步。短期来说,这可以加快在语言解读和文本理解上的响应。长期来说,它有助于实时分析你的所见所讲。“我们是在说转瞬之间的事情——这必须要做到实时。”他说,“我们是社交网络,如果我要预测人们对于某个内容的反馈,那我的系统就需要即时作出响应,对吧?”

“在手机上运行复杂的神经网络,意味着你将AI带到每个人的手中。”他说,“这不是偶然发生的事情。它是我们在公司内部广泛推广AI的一部分。”

“这是一个漫长的征程。”他补充道。

坎德拉的出身

坎德拉出生于西班牙。他在3岁时随家人移居摩洛哥,并在那里上法语学校。虽然他的科学和人文学科成绩非常优异,但在决定到马德里上大学时,他选择了他认为最难的学科:电信工程。电信工程不仅仅需要掌握像天线和放大器这样的物理知识,还需要懂得数据分析,这在他看来“很酷”。他非常仰慕一位改造自适应系统的教授。坎德拉做了个系统,利用智能过滤器来改进漫游手机的信号;如今他称这是“幼小版神经网络”。他痴迷于训练算法,不满足于只是编写代码。在2000年在丹麦度过的一个学期,他遇见曾在多伦多与机器学习领域的传奇杰夫·辛顿(Geoff Hinton)一道学习的机器学习教授卡尔·拉斯马森(Carl Rasmussen),这进一步激发了他对训练算法的热情。在毕业之际,他准备进入宝洁公司的一个领导力项目。此时拉斯马森则邀请他去读博士,最终他选择了机器学习专业。

2007年,他加入微软研究院位于英格兰剑桥的实验室。他在加盟不久后获知公司要举行比赛:微软准备推出必应,但需要在搜索广告这一重要组成部分上进行改进——准确预测用户会在什么时候点击广告。该公司决定就此举行内部比赛。胜出团队的解决方案将接受测试看看是否值得推出,团队成员也将获得免费到夏威夷旅游的奖励。19个团队参与竞争,最后坎德拉的团队并列获得冠军。他获得了免费出游的奖励,但微软却迟迟没有兑现更大的奖品(展开测试来决定他的作品是否可以推出),这让他感到受骗。

后来发生的事情充分显示了坎德拉的决心。他开启疯狂的穷追不舍模式,以让公司给他一次机会。他进行了超过50次的内部讲话,他打造了模拟器来证明其算法的优越性。他也不断游说那位握有决策权的副总裁,不管后者去到哪,包括洗手间,他都伺机接近,不停宣讲自己的系统。

2009年,坎德拉的算法随必应推出。

2012年初,坎德拉探访在Facebook供职的一位朋友,在它的门洛帕克园区呆了一个周五。他惊讶地发现,在这家公司,人们并不需要乞求上级批准测试他们的作品。他们直接那么做就行了。在接下来的周一,他去Facebook面试,周末便拿到了要约。

当初的模型并不先进

加入Facebook的广告团队后,坎德拉的任务是领导一个小组展示相关度更高的广告。坎德拉说,虽然当时的系统有使用机器学习技术,“但我们所使用的模型并不是很先进,它们很简单。”

侯赛因·梅汉纳(Hussein Mehanna)是另一位跟坎德拉同时间加盟Facebook的工程师,他同样对该公司的系统在整合AI上缺乏进展感到惊讶。“在我还没有加入Facebook之前,看到该产品的质量,我以为一切都已经成型,但很显然还没有。”梅汉纳说,“在入职几个星期后,我就跟坎德拉说,Facebook真正缺少的是一个合适的世界级机器学习平台。我们有机器,但没有合适的软件来帮助机器尽可能多地从数据学习。”(梅汉纳如今是Facebook核心机器学习主管,也曾在微软供职多年——本文另外几位受访的工程师也是微软出身。巧合?)