幕后英雄:走进Facebook 有史以来最大的人工智能项目

为此 Facebook 每天要进行数十万亿次的查询,以便能每秒做出六百万个预测。Facebook 用数十亿个数据点来训练支撑其 News Feed 的算法。这家公司每十五分钟到两小时就更新一次它的学习模型,以便能对当下事件作出快速反应。

当一台电脑能从语法上分析那么多的信息并作出判断时,这也是令人不安地提醒我们,我们数字生活的每个方面都正在被它以向广告商、研究人员甚至政府展示我们私下想法和行动的方式分割、切片再切块。同样棘手的是,机器学习算法还有可能会犯错。

而且这些都还不能解释这一事实:许多人甚至还不知道,机器学习算法正在改变他们对产品的体验。一个人没有看到自己的News Feed 中的某个内容的原因或许在于算法把这个内容过滤了。2014 年,麻省理工学院的一项研究发现,62.5% 的研究参与者都没有意识到 Facebook 过滤了他们的 News Feed 。

「最好的人工智能算法能泛化,他们能预测你想要什么,但它们从来都不是完美的,」Candela 说。这也是 Schroepfer 之所以相信 Facebook 距离「把一切都交给人工智能技术」还很遥远的理由之一。

「我认为,你仍要人处在决策环中,」Schroepfer 说。「我们正在为他人创造产品,而我很难相信机器能计算出其他人想要什么,哪怕是使用这些高级科技。」

Schroepfer 说,这一工作都是为了打造一个社交网络,能够更好地预期用户想要看到什么或体验。如果你这一天过得很糟糕,他希望 Facebook 能给你看一段诙谐的小猫视频。如果你有一星期都没和你母亲聊过天,他希望 Facebook 能识别出这一点并主动为你推送一些关于她的生活的信息更新。

「Facebook 当下的问题是,关于你想要什么,你告诉我们的东西还不够多。」Schroepfer 说。「我们在努力猜测你想要什么。问题的一部分是,我们不知道该问你什么,而当你告诉我们你想要什么的时候,我们也不确定对此该做些什么。因为我们的系统还没有真正在这方面安排好、优化好。」

应用机器学习( Applied Machine Learning)团队的建立为创建这样的系统提供了机会。同时,FAIR 团队也提供了机会让我们能建立关于「如何让机器去学习」的更好理解。

Facebook 做出了以这种方式在人工智能研究方面高歌猛进的决定,与竞争者们相比,它这么做有些不同寻常。

例如,微软旗下的研究院拥有一支庞大的人工智能研究队伍,但微软并没有把这方面的努力移交给一个商业化团队,再让这商业化团队把它转化成供内部使用的产品。相反,研究人员会直接与产品团队的人一起工作,建立使用深度学习的工具或新的服务。

据微软研究院院长 Peter Lee 说,在对外方面,微软正在试图建立一个为机器学习提供服务的平台,并通过它的云计算平台 Azure 把这些服务提供给客户。

不过,Lee 和 Facebook 的 Schroepfer 在这一点上是一致的:机器学习和人工智能正在使公司们能创建一些新的产品,这些产品在过去曾因太耗费时间或资源而无法实现。

从微软跳槽到 Facebook 的 Candela 说, 他有意要在 Facebook 努力创造出一个不一样的组织结构,因为他感到当他还在微软时,好想法无法在组织中快速散播。每一个新发明或新人工智能算法都被封闭在其所在的团队里。他说,Facebook 正在努力抵抗这种习气。

然而, 卡耐基梅隆大学计算机科学院院长 Andrew Moore 怀疑,像 FBLearner Flow 这样的人工智能平台真的能在一个组织中得到广泛应用。他说,大部分的机器学习模型都无法泛化。

「对机器学习来说,有一个陷阱,据我所知还没有哪家大公司未曾掉入这个陷阱。」他说。「看起来建立一个平台来支持机器学习算法似乎是很有用的,然而你会发现,每个使用机器学习的应用程序都需要调用不同的应用程序才能使用机器学习。因此,在机器学习平台的建造者和那些试图用平台来制造产品的客户之间常常存在着断裂。」

到现在为止,Facebook 仍然乐于付出这些努力,而且这些努力似乎也在它的新产品中带来了回报。随着更多的决策交给算法决定,这家公司有许多事情需要调整。不过,这个综合一切的项目已经改变了这家公司衡量其成功的方式。

例如,Facebook 发起的实名政策要求人们在其网站上使用真名,而这令跨性别者(他们可能并不认同他们出生时的名字)、美国原住民的后代(他们的名字不太容易用西方格式表示)和遭受侵犯虐待者(他们需要保留更多的隐私)感到不安。然而,当时 Facebook 的算法很难分析这些名字以适应这些需求。