人工智能时代来临:微软开发深度学习项目Adam,挑战谷歌

微软The Project Adam图片识别功能,包括狗狗品种的区分

我们正在进入一个人工智能的时代。包括谷歌、微软和苹果这样的科技巨头们,正在利用他们手中的学术研究能力,开发新一代的人工智能技术,这项技术被称为深度学习。通过这项技术人们可以完成语音识别、机器翻译、机器视觉等等任务。

人们普遍认为谷歌是处于这项技术研究的前列。谷歌聘请了深度学习技术的大牛人物,多伦多大学的Geoff Hinton教授。而且谷歌也公开的讨论了深度学习对于现实世界的推动,比如安卓手机上的语音搜索功能,在这个领域已经保持了很多的记录。

但是近日微软研究院(Microsoft Research)的团队表示,他们的最新深度学习系统Adam要更胜一筹,预计将在近日在微软总部召开的一次技术峰会上首次披露相关的消息。按照微软的说法,Adam识别图片的精度要比现有的系统高两倍,而且使用的计算资源要少很多。这项计划的领头人Peter Lee表示,Adam就是微软对于打造最强大脑的尝试。

The Project Adam团队:从左到右依次为Karthik Kalyanaraman, Trishul Chilimbi, Johnson Apacible, Yutaka Suzue.

Lee表示,他们曾经做过一个名为ImageNet 22K的测试,结果要比Google Brain的效果要好。微软的系统采用神经网络算法,能够处理22000种以上的图片,而能够拥有这种计算能力的并不多。

微软的秘密在于,它优化了计算机处理数据的方法,并且还更好的控制了计算机之间的通信。其实Adam这项目的想法来自微软一面名为Trishul Chilimbi的研究员。

跟其他的深度学习系统类似,Adam也运行在服务器集群上。深度学习旨在通过创建神经网络,更好的模仿大脑工作的方式,而通常来说,这种神经网络都需要大量的服务器资源。微软的特殊之处在于它使用了非同步的技术。

随着计算系统变得越来越复杂,机器之间的通信变的越来越困难,但是非同步技术减轻了这个问题。所谓非同步就是将整个系统分为不同的部分,而这些部分可以独立运行,但是也能彼此的通信并合并为一个整体。其实这项技术在手机和电脑上已经实现了,主要就是在不同的处理器上进行计算。但是对于这么大规模的服务器系统,还暂时没有成功的案例。但是包括谷歌和微软这样的大公司,其实对于这种非同步技术的开发已经持续很长的时间了,而微软的Adam其实来自威斯康辛大学的一个名为HOGWILD的技术原型。

HOGWILD的本意是让一台计算机内的各个处理器更加独立工作的技术,不同的处理器可以向同样的内存写内容。对于大部分的系统来说,这都不是一个好注意,因为可能会有数据冲突的问题,不同机器之间会相互覆盖的,只能在某种特殊情下才能运行。但是HOGWILD就能解决这个问题,一台机器的运算速度会明显的加快。而Adam技术相当于把这个想法更近一步,将HOGWILD应用在整个网络上。

微软表示这种方法能够让神经网络更好更快的训练他们自己,去理解图片之类的东西。深度学习大牛Andrew Ng表示,这种方法很激进,但是确实可以节省很多的计算资源。Andrew Ng已经被百度聘请。

另外Andrew Ng还对于一个问题非常的惊讶,那就是Adam运行在普通的处理器上,而不是GPU上,因为现在GPU加速是非常流行的技术。很多的深度学习系统都在采用GPU来避免通信堵塞的问题。但是很多的技术专家都认为GPU还不能直接规模化到大型的神经网络,因为数据中心的通信速度,有时候会赶不上GPU内部的数据通信的速度。负责Adam项目的Chilimbi就是其中一个。

微软表示Adam会是完全不同的系统,但是很多的深度学习专家都表示其实微软的系统跟谷歌的并没有那么大的不同,尤其是在不清楚具体的技术细节的时候,很难断定其中的程度到底如何。比如曾经复杂开发Google Brain的 Matt Zeiler就表示,微软的结果跟业界的普遍研究结果不太匹配,但是确实很有意思。Matt Zeiler现在已经从谷歌离职,并创办了自己的深度学习公司Clarifai。微软的Lee 表示,这个项目其实还处于萌芽阶段。他们在内部开发了一款app可以识别图片。而Lee自己用这个app识别过狗粮和毒虫。但是Lee认为这个技术在电子商务、机器人和情感分析方面还是有很大的潜力的。另外他们还在尝试使用FPGA来更好的提速。

Lee相信Adam一定能成为终极人工智能的一部分,这种技术能媲美人类处理任务的方法,比如讲话、图像和文字等等。这项技术的发展之路今后还是很长的,而且已经有了50年的历史,但是有一点可以确定的是,我们已经离目标更近了。

(via wired 译/快鲤鱼)