目前,谷歌、Facebook、微软、Twitter和百度等互联网巨头,都在使用这种叫做GPU的芯片,让服务器学习海量的照片、视频、声音文档,以及社交媒体上的信息,来改善搜索和自动化照片标记等各种各样的软件功能。一些汽车制造商也在利用这项技术,开发可以感知周围环境、避开危险区域的无人驾驶汽车。
除了在GPU和图形计算领域长期领先,英伟达也是最早一批在人工智能领域进行投资的科技公司。2008年,当时在斯坦福做研究的吴恩达发表了一篇用GPU上的CUDA进行神经网络训练的论文。2012年“深度学习三巨头”之一Geoff Hilton的学生Alex Krizhevsky用英伟达的GeForce显卡在ImageNet中将图像识别准确率大幅提升,这也是英伟达CEO黄仁勋时常提到的英伟达注重深度学习的开端。
有报告显示,世界上目前约有3000多家AI初创公司,大部分都采用了Nvidia提供的硬件平台。
“深度学习被证明是非常有效的。”黄仁勋在季报2月10日的发布会中表示。在列举目前GPU计算平台正在人工智能、云计算、游戏和自动驾驶领域快速展开应用的同时,黄仁勋表示,在未来数年间,深度学习将会成为计算机计算的一种基础性的核心工具。
AMD和Intel巨头的AI演变
投资者和芯片制造商关注着所有互联网巨头的一举一动。仅仅以英伟达的数据中心业务为例,在很长一段时间以来,该公司一直为谷歌提供数据服务。
英伟达并非GPU的唯一领先者,巨头Intel和AMD都在这一领域有着不同的优势。
2016年11月,Intel公司发布了一个叫做Nervana的AI处理器,他们宣称会在明年年中测试这个原型。如果一切进展顺利,Nervana芯片的最终形态会在2017年底面世。这个芯片名称基于Intel早前购买的一个叫做Nervana的公司。按照Intel的人所说,这家公司是世界上第一家专门为AI打造芯片的公司。
Intel公司披露了一些关于这个芯片的一些细节,按照他们所说,这个项目代码为“Lake Crest”,将会用到Nervana Engine和Neon DNN相关软件。这款芯片可以加速各类神经网络,例如谷歌TensorFlow框架。
芯片由所谓的“处理集群”阵列构成,处理被称作“活动点”的简化数学运算。相对于浮点运算,这种方法所需的数据量更少,因此带来了10倍的性能提升。
Lake Crest利用私有的数据连接创造了规模更大、速度更快的集群,其拓扑结构为圆环形或其他形式。这帮助用户创造更大、更多元化的神经网络模型。这一数据连接中包含12个100Gbps的双向连接,其物理层基于28G的串并转换。
TPU与FPGA可能的逆袭
在上述芯片巨头进行GPU领域的提升之外,有更多的企业在试图引发一轮全面的颠覆。其代表为谷歌在2016年宣布将独立开发一种名为TPU的全新的处理系统。
TPU是专门为机器学习应用而设计的专用芯片。通过降低芯片的计算精度,减少实现每个计算操作所需的晶体管数量,从而能让芯片的每秒运行的操作个数更高,这样经过精细调优的机器学习模型就能在芯片上运行得更快,进而更快地让用户得到更智能的结果。Google将TPU加速器芯片嵌入电路板中,利用已有的硬盘PCI-E接口接入数据中心服务器中。
据Google资深副总裁Urs Holzle 透露,当前Google TPU、GPU 并用,这种情况仍会维持一段时间,但他表示,GPU 可执行绘图运算工作,用途多元;TPU 属于ASIC,也就是专为特定用途设计的特殊规格逻辑IC,由于只执行单一工作,速度更快,但缺点是成本较高。
除了上述提到的谷歌,微软也在使用一种叫做现场可变编程门阵列(FPGA)的新型处理器。
据介绍,这个FPGA 目前已支持微软Bing,未来它们将会驱动基于深度神经网络以人类大脑结构为基础建模的人工智能的新搜索算法,在执行这个人工智能的几个命令时,速度比普通芯片快上几个数量级。有了它,你的计算机屏幕只会空屏23毫秒而不是4秒。
在第三代原型中,芯片位于每个服务器的边缘,直接插入到网络,但仍旧创造任何机器都可接入的FPGA池。这开始看起来是Office 365可用的东西了。最终,Project Catapult准备好上线了。另外,Catapult硬件的成本只占了服务器中所有其它的配件总成本的30%,需要的运转能量也只有不到10%,但其处理速度却是原来的2倍。