日前,在太原理工大学主办的世界大学生超算竞赛上 (ASC15 ),来自新加坡的南洋理工大学代表队凭借NVIDIA Tesla K80加速卡获得了HPL(Linpack)项目测试的冠军。除南洋理工大学之外,包括清华大学、台湾清华大学、上海交通大学、中山大学、浙江大学等其他5支队伍也取得了不俗的成绩,其中清华大学更是获得了ASC15大赛的总冠军。为何使用Tesla加速卡能够获得如此优秀的竞赛表现,在生态系统和人才培养方面NVIDIA与高校又有着怎样的合作呢?我们在竞赛现场采访到了NVIDIA亚太区首席技术官Simon See。
NVIDIA与高校合作缘由
多年来,NVIDIA(英伟达)在中国市场一直致力于合作伙伴与生态圈的建设,特别是对于Tesla产品线来说,自多年前推出CUDA架构与编程平台以来,NVIDIA(英伟达)一直与国内高校保持紧密的合作关系。据Simon介绍,NVIDIA(英伟达)目前与中国高校合作共有3种形式。“一个项目叫做CCOE,一个项目叫做CTC,再就是Research Center。其中,Training Center主要是培训学生、培训老师,做到普及的作用。Research Center是在不同的领域上,高校老师、教授都可以提出申请,比如在流体力学或者哪些方面对CUDA有深刻的研究,我们可以提供帮助。CCOE是比较全面一些,里面包括有科研、培训等内容,主要面向多元化的合作。”
在谈到之所以与高校采取紧密的合作问题时,Simon认为——很多NVIDIA(英伟达)的应用都是从学校开始的,很多NVIDIA(英伟达)的应用都是学生或者老师,在从不同的角度试着解决一些问题的时,发现 采用GPU解决问题的。所以我们跟很多的学校合作,不只是在中国,我们在全球都跟很多学校合作,像美国的斯坦福大学、新加坡南洋理工大学,还有其他的学校等。
▲清华大学应用Tesla加速卡获得冠军
事实上,随着CUDA平台的推广,越来越多的用户开始加入NVIDIA(英伟达)生态阵营。如今,NVIDIA(英伟达)在生态系统的建设上已经颇具规模。但是对于类似ASC这样的国际超算赛事,为何NVIDIA(英伟达)还会积极的参与呢?Simon解释说:“要把CUDA用到非常好,要掌握很多的技术,经过很多层面的培训。我们积极参加这种竞赛,就是想让大家知道在CUDA里面原来还可以找出更加好的方式来解决一些应用,从而优化CUDA的应用。如果没有这样的竞赛,只能说是有些人会用而已,从学生的角度说,我只是学了一个CUDA的知识,但是没有一种挑战感,所以让学生来参加这样一个比赛,来比一比谁能把CUDA做得更好,也是促进CUDA在应用领域做得更好的一种方式。“与此同时,Simon更看重长远角度用户对于NVIDIA的推动作用“CUDA一直在发展,到7.5的时候又会有新的应用,如何要让大家知道这些新应用的出现,最好的方式就是参加竞赛,在竞赛里面,学生有可能会用到这个东西,也可以帮助把CUDA的应用做得更好。”
新加坡南洋理工大学应用体验
除NVIDIA对于应用的推广之外,新加坡南洋理工大学参赛领队老师则从应用的角度解读了NVIDIA Tesla产品和CUDA平台对于超算应用的实际意义。在谈到如何取得HPL项目的第一名时,他表示:“我们目标就是获得HPL的冠军。我们首先把Tesla K80最大的能量完全发挥出来,然后再一点点往下调,然后我们觉得距离我们所能达到的物理极限,已经是相当的接近了。”“比赛的功耗的限制是非常严重的,一不小心就会超过,很多队都是在这个问题上被困住”,“我们最后在权衡之下,决定一块也不拆,八块全部留在上面,然后寻找其他的途径去减少整体的功耗,其实也是挺幸运的。”
其实早在多年前,南洋理工大学就已经与NVIDIA展开深度合作。2010年,新加坡南洋理工大学成为NVIDIA(英伟达)在新加坡授权成立的首个GPU技术研究中心,由计算机学院副教授Douglas Maskell博士和助理教授何丙胜博士负责,开展基于GPU的大数据、数据库、生物信息学、多媒体等领域的科学研究,并且和英伟达开展深入而广泛的合作,在计算机与其他领域的交叉学科进行了开创性的研究。为进一步推进GPU计算的普及,NVIDIA(英伟达)授权在南洋理工大学成立东南亚首个GPU教学中心,也在计算机学院本科生课程中开设并行计算以及GPU计算相关课程,培养大量并行以及超算的人才。