开发AI可是个大工程 脸书想让AI自己开发AI

深度神经网络正在重塑互联网。通过分析大量的数字信息,深度神经网络可以自己学习,执行人类执行的任务,就在短短几年前,类似的智能系统还无法植入到网络服务中去。

要开发深度神经网络解决下一个AI大问题,研究人员必须经历无数次失败的尝试,在一台、几十台甚至几百台机器中尝试。“我们更加像是教练而非运动员。”DeepMind联合创始人Demis Hassabis认为,“你引诱它们做一些事,而不是直接告诉它们做什么。”

正因如此,许多企业试图将实验和错误变成自动化流程——或者至少将其中的一部分自动化。如果可以将最繁重一部分任务自动化,你就可以向前再进一步,让最新的机器更快速学习,只需要一般的工程师引导就可以了。如此一来,最顶尖的人才可以有更多时间专心研究更大的创意和更难的问题。最终,AI在互联网APP和服务中的进化速度会更快。

换句话说,随着计算机越来越聪明、越来越快,计算机本身可以处理更多简单单调的任务。互联网巨头正在开发计算系统,让它们代表工程师测试无尽的机器学习算法,它们自己就可以循环测试许多的可能性。更棒的是企业正在开发一套AI算法,让算法来编写AI算法。没有开玩笑。Facebook工程师正在设计所谓的“自动机器学习工程师”和人工智能系统,它可以协助开发AI系统。要让技术达到完美还有很长的路要走。但Facebook的最终目标是开发一套新的AI模式,让人类从事的单调乏味工作尽可能少。

2012年,Facebook成功IPO,候赛因米汉那(Hussein Mehanna)和Facebook广告团队的工程师感到压力加大,因为公司的广告销售目标提高,他们需要提高广告和无数用户的匹配度。Facebook拥有无数用户,公司会根据用户的特点和行为收集数据,开发深度神经网络及其它机器学习算法可以更好地利用庞大的数据库。

据米汉那透露,在开发新的AI时,Facebook工程师并不缺少创意,但是要测试这些创意却是另一回事。为了解决问题,他和团队开发了所谓的“Flow”工具。“我们想开发一条机器学习组装线,所有的Facebook工程师都可以使用。” 米汉那说。Flow的设计目的是为了帮助工程师大规模开发、测试、执行机器学习算法,它实际上包括了任何类型的机器学习——也就是说这门技术是一门泛技术,可以覆盖到所有服务,大部分学习任务依赖机器自己完成。

“你尝试的创意越多,结果就越好。”米汉那认为,“你测试的数据越多,结果也会越好。”有了新工具,别人开发的算法工程师可以拿来重新利用,十分轻松,修改算法应用在其它任务上也会简单许多。

很快,米汉那与团队就将Flow应用到整个公司。其它团队利用Flow生成算法,从用户的News Feed中挑选链接,还可以识别社交网络中的图片,为照片添加音频标签,盲人可以根据音频了解自己看的是什么东西。

据米汉那透露,有了Flow之后,Facebook每月可以训练、测试大约30万种机器学习模型。以前在Facebook社交网上推出一个新AI模型需要60天左右的时间,现在每周就可以发布几个新的模型。

事实上,深度学习的应用前景远不止如此。去年,Twitter收购了WhetLab,它是深度学习的专家。最近,微软告诉外界自己的研究人员如何利用一套系统测试海量AI模型。微软研究人员Jian Sun管它叫“人工助手搜索”。

Facebook希望能加速前进,它的目标是打造一个开源Flow,与整个世界分享,LinkedIn、Uber、Twitter已经有兴趣使用它。米汉那还与团队开发了一个名叫AutoML的工具,它可以更多地承担人类工程师的工作。AutoML运行于Flow之上,可以自动“整理”用于训练神经网络和其它机器学习算法的数据,不需要人的干预就可以准备好测试数据,在米汉那的理想中,他们希望AutoML最终可以自己收集数据。更有趣的地方在于:AutoML也许可以利用AI来开发AI。