问鼎高性能云计算之王?中国高性能云计算创新大赛见分晓

“Show出你的野蛮性能”并不是一句漂亮的空话,高性能云计算的实力正在被6大知名云服务商和20多所高校队伍同步验证,谁才是真正的CPU/GPU云主机之王?

高性能

3月11日,首届“中国高性能云计算创新大赛”(以下简称“大赛”)现场赛正式落下帷幕。大赛由中国信息通信研究院和中国计算机学会高性能计算专业委员会共同举办。

本次大赛分别面向云计算服务商和科研机构设计了CPU云主机和GPU云主机的性能测试赛程。参赛阵容非常强大,吸引了国内多家知名的云计算服务商及顶尖的科研机构和企事业单位共同参与。

加入战队的云计算服务商有阿里云、华为云、腾讯云、天翼云、UCloud和百度云,参与应用场景测试初赛的有清华大学、北京大学、北京邮电大学、北京工业大学、北京林业大学、北京交通大学等20多所高校。

高性能1

经过严格的参赛方案评选以及一个月的实测阶段,最终进入现场赛答辩的高校队伍共有4支,他们分别来自北京林业大学、北京交通大学、清华大学和兰州大学。值得一提的是,还有一名来自知名IT厂商的资深工程师以个人名义参赛,最终也进入到决赛答辩环节。

现场赛回顾:应用场景多样化,水平超预期

根据本次大赛规则,由云计算服务商提供CPU和GPU云主机,参赛队伍则提交自己编写设计的应用场景方案,通过在各厂商提供的云主机上运行来检验厂商云主机性能。

其中,CPU云主机在网站应用、视频流媒体、大数据分析、图像分析四个应用场景进行性能测试,GPU云主机在图形渲染、机器学习两个场景进行性能测试。

据了解,此次报名参赛的队伍提交的应用场景方案,基本上覆盖了大赛规定的所有场景,从多个应用场景对各厂商的云主机进行了性能测试。

例如,兰州大学的参赛方案是关于糖尿病受体与药物的分子动力学模拟。方案设计了基于CPU和GPU架构的NAMD分子动力学代码,模拟出GLP-1R蛋白和药物分子相互作用的场景,同时完成GPU下加速性能的测试和比较。通过对测试性能指标的分析,找出云计算平台最佳的CPU-GPU数量配比。

该方案使用了4-8台CPU云主机和1-4台GPU云主机,其中每台CPU云主机核心数在12-48之间,每台GPU云主机有1-8块NVDIA Tesla系列GPU卡,从而进行多个GPU卡的并行测试。由于并行计算的规模较大,测试例耗时(完整运行一次测试例耗时)高达96小时。

高性能2

兰州大学参赛队伍在现场赛中答辩

清华大学的参赛方案是对海量文档进行主题模型分类,使用隐式狄利克雷算法(LDA),将稀疏求解的算法应用在GPU上,以达到比CPU更快的求解速度。该方案使用了1台CPU云主机和1台GPU云主机,测试例耗时约为30个小时。

北京林业大学的参赛方案则是基于TensorFlow搭建卷积神经网络,结合GPU高性能计算特点,实现人群计数。该方案使用了1台CPU云主机和2台GPU云主机,通过测试对比发现,在GPU上训练迭代一次所需时间小于1秒,在CPU上训练迭代一次所需时间约为9分钟,GPU可大幅提升训练性能。

据主办方介绍,此次参赛队伍整体水平之高超出预期,其中部分项目已申请成为国家重点项目暂时无法对外公开信息,也有的项目具备在实际应用落地的实力,因而也备受各厂商的瞩目,有望在比赛之后继续推动云服务商和科研机构之间的合作。

让强者更强:产学研深度结合,赛事创新

事实上,高性能计算赛事并不少见,为何此次中国高性能云计算创新大赛一推出,就有如此多知名厂商和科研机构的踊跃参与,并收获了高质量的参赛成果?不妨看看此次大赛与众不同的地方。

首先,参赛的云服务商和科研机构双向选择。换句话说,云服务商与信通院一起筛选出院校的优秀案例,是优中选优,云服务商只对看中的参赛方案提供云主机的资源支持。

同样,科研机构也会主动选择自身认可的品牌云主机进行测试。这对于云服务商和科研机构双方来说,都是一种挑战,无形中拉高了竞争的门槛。