浪潮张清:面向人工智能的计算解决方案

还有一个案例就是在网络安全方面的应用,此应用采用深度学习技术,用户实现基础的Python算法版本,我们帮助实现GPU的迁移与优化,单个GPU计算,其性能比原来CPU基准版本加速了90倍,采用四块GPU并行,其性能是基准CPU版本的270倍。

最后一个应用案例是线上语音识别应用,采用DNN深度神经网络,帮助用户把DNN从CPU平台到FPGA平台的迁移与优化,1块FPGA卡的性能相当于两块CPU的2.8倍。功耗只有CPU的15.7%,性能功耗是CPU的18倍。

基于AI系统四个层次设计所面临的挑战和相应解决方案,我们设计了整个AI端到端的解决方案,针对不同的数据源,如图像、视频、语音、文字等首先会送到我们CPU的处理平台上面进行预处理,预处理完的数据我们会存放到共享存储上去,然后GPU的集群训练平台会从存储里把训练数据并行读取过来进行训练,整个训练平台我们可以采用4 GPU、8 GPU或16 GPU BOX设备,在训练平台我们会部署深度学习管理系统AIStation和天眼工具。训练完之后的生成的模型,将会加载到不同的计算设备上去,如P8000 GPU 工作站、FPGA卡、GPU AI云平台进行推理识别的服务。最后实现各种智能结果。就是说我们整个AI端到端计算的解决方案。

钛坦白群友互动

1.浪潮面向人工智能开发的计算平台,如之前发布的GX-2,相对于其他的计算产品有什么特点?

张清:GX-2目前是全球最高密度的GPU服务器,他在2U的空间里可以插8块GPU卡,既可以支持PCIE,而且还可以支持NVLINK 2.0。

2.浪潮的方案都是基于GPU,请问张总浪潮的人工智能平台和其云计算解决方案或超融合架构有何匹配及联系?数据如何获取?硬件方面都是采用通用服务器?

张清:浪潮的方案在模型训练主要是GPU方案,推理我们还有FPGA方案。目前浪潮的人工智能平台和其云计算解决方案或超融合架构没有对应匹配及联系。数据有些来自开源社区、有些来自客户,还有些是公共平台数据。硬件方面主要采用通用服务器,也有与用户定制化开发的服务器,如SR-AI Rack.

3.公共数据平台主要指?包含运营商等渠道吧?用户是在平台上沉淀的用户数据,应该不会直面最终用户吧?

张清:公共数据平台主要是指浪潮的天元大数据,有政府公开数据、联盟伙伴数据、浪潮自有数据。用户在平台上沉淀的数据仅作为实验使用,用户实际场景的数据不会直面给其他最终用户。

群友:相当于应用层能力开放,人工智能平台聚合开发者做的应用,然后用户数据直接积累到平台。

张清:嗯,用户的实验数据会积累到平台。