GTC CHINA 2016 NVIDIA开启人工智能黄金时代

  2016年9月13日,GTC CHINA 2016 (GPU技术大会)在北京召开,NVIDIA联合创始人、总裁兼首席执行官黄仁勋出席大会,深度阐释GPU计算产品与解决方案平台将如何拓展人工智能发展的想象空间,加速人工智能改变未来的进程;同时,NVIDIA全球首发了两款深度学习和自动驾驶最新产品,宣布了与京东等领先企业的合作项目。

  NVIDIA CEO 黄仁勋出席GTC CHINA 2016并发表主题演讲

  GTC由全球视觉计算技术的行业领袖及GPU的发明者NVIDIA公司主办,每一届GTC都汇集了数千名致力于通过GPU来解决重大计算难题的科学家、工程师、研究员、开发者乃至整个生态系统的企业代表的参加。在过去两年,参会人数增长了4倍,而NVIDIA开发者增长了3倍达到400,000人。作为深度学习开发标准,使用NVIDIA GPU的人工智能开发者增长了25倍。本次GTC CHINA 2016吸引了国内外近3000名行业精英参加,共同探讨GPU在人工智能、深度学习、大数据、高性能计算,虚拟现实以及自动驾驶等前沿技术领域的应用和前景。

  黄仁勋表示:“有史以来,计算机和软件在视觉和听觉这两种人类最基本的感官上,第一次达到了超越人类的水平。将GPU应用于深度学习至关重要,如今我们有了突破性的科技能在未来数年中用于加速人工智能的发展。人工智能计算将解决许多其他软件无法解决的问题,引领交通、医疗和社会生活中各个方面的人工智能革命。”

  人工智能引领第四次工业革命,深度学习成为全新计算模型

  数据显示,到2025年,人工智能市场将达到360亿美元的规模,人工智能将成为 IT 领域中发展最快的部分,或将引领继蒸汽机,电力,计算机之后的第四次工业革命。人工智能是GPU计算的终极挑战。来自谷歌的Jeff Dean说,深度学习将通过“更多数据、更大的模型、更多的计算”来优化;微软的 ResNet 增加了网络的复杂性,它比 AlexNet 模型复杂 16 倍;百度的 DeepSpeech,在一年中增涨了 4 倍模型尺寸,2 倍数据,以及 10 倍的计算。

  深度学习作为全新的计算模型,正在改变计算的方方面面,不仅改变了软件开发的方式、开发地点和运行方法,还在改变着服务器架构、数据中心和智能设备。在深度学习的训练方面,网络的设计和训练都需要数万亿次的运作,而GPU使其切实可行,可训练更有深度更准确的模型,加速产品上市时间。在数据中心推理方面,对于云服务来说,网络将运行在数据中心里,每天经历数以万计的图片、声音和视频的查询,而GPU推理可快速回应,实现数据中心吞吐量最大化。在设备推理上,即使面对数十亿智能设备的运行规模,GPU也能做出实时精确响应。

  深度学习最苛刻的部分是训练,而NVIDIA专为深度学习设计的PASCAL架构,助推深度学习加速高达65倍,并且能够支持每个主要的深度学习框架。在此架构基础上,NVIDIA创造了专为GPU深度学习所设计的超级计算机DGX1。

  全球首发两款新品,打造新一代计算平台

  在本次大会上,NVIDIA全球首次发布了最新深度学习推理加速器Tesla P4/P40和自动驾驶汽车专用人工智能超级计算机DRIVE PX 2。

  Tesla P4 和 P40 是专门为深度学习推理设计的加速器,可以使用经过训练的深度神经网络来识别语音、图像或文字,以响应用户和设备的查询。其中,P40专为最大吞吐量而设计,并能将CPU推理加速40倍;为加速1U OCP服务器而设计的P4,功率仅为50瓦。鉴于一个现代化的网络可能有上百层和数以万计的参数,网络的复杂性增加了多样性和准确性,但也降低了推理性能,因此NVIDIA 发布性能优化推理的引擎TensorRT,不仅将复杂性减少 2 倍甚至更多,而且不通过融合操作,移除低贡献的权重,降低 FP16 或 INT8 精度,以及许多其它影响性能的技术。未来,在今年美国GTC上发布的超大规模数据中心加速器Tesla P100将与全新 Tesla P4/P40在深度学习的训练和推理两端,为数据中心带来端到端的深度学习平台。此外,本次大会上,IBM还发布了配置有Tesla P100和NVLINK高速互联技术的全新POWER8服务器,将为人工智能企业提供领先高效的计算能力。

  同场发布的还有针对汽车自动巡航功能的人工智能计算机DRIVE PX 2,这款只有手掌大小的超级计算机采用新型单处理器配置,功率仅为10瓦,可以利用深度神经网络处理来自多个摄像头和传感器的数据,通过实时了解周边环境、在高清地图上精确定位,以及规划安全行车路线,实现安全的自动巡航。DRIVE PX 2将帮助汽车制造商为自动化无人驾驶汽车的驾驶和制图功能提供支持,更快更顺利的把研发成果应用于实际产品中。