CUDA高密计算云技术发展研究

rCUDA,通过socket的通信方式在远程执行CUDA,相对采用RPC的vCUDA来说,效率有所提高。

GVim通过建立前端、后端、拦截库、库封装器四个模块来实现API的拦截和重定向。但是该解决方案只适用于特定的Xen虚拟化平台。

gVirtuS在vCUDA和GVim的基础上,独立实现了GPU虚拟化架构,保证了平台无关性,适用于Xen、VMware、KVM等主流的虚拟化平台。

CUDA高密计算云应用现状

自2007年提出CUDA以来,NVIDIA公司一直致力于云计算平台与CUDA的技术结合。其率先于2012年5月推出利用GPU加速云计算技术,同年10月推出了首款云计算虚拟GPU加速平台—VGX K2,并于2013年GTC大会上推出了云计算产品服务器平台—NVIDIA GRID。GRID 卡采用基于 NVIDIA Kepler架构的GPU,首次实现了 GPU 的硬件虚拟化。这意味着多名用户可以共享单一GPU。随后,国外的多家云服务提供商也推出了各自的基于GPU并行计算的云服务平台,包括Amazon、Nimbix、Peer 1 Hosting等。

在国内,“云图”和“云渲染”方案的提出,也标志着云服务提供商开始在GPU高密计算方面发力。“云图”(W760-G10)由曙光公司、NVIDIA公司、思杰公司于2014年合作推出,虽然尚未有明确的云租用服务,但已具备GPU硬件虚拟化的能力。阿里云于2013年提出“云渲染”方案,在国产3D动画电影《昆塔》中首次使用了云计算进行后期渲染的新技术,通过将一个或者多个渲染任务分割成若干部分,在计算机集群中的各个节点同时进行,以此类推,大大缩短渲染时间。

可以预见,随着CUDA与云计算的紧密结合,强大的GPU计算能力将推动云服务平台在图像分时、动画渲染、视频编码、3D运算、导航识别、数理统计分析以及大数据挖掘等领域发挥重要作用。