中国高性能计算迈向全面发展

  本届HPC TOP100榜单的一个喜人变化是,超过75%的高性能计算系统应用在数据挖掘、视频分析、事物处理等新兴领域,而应用于科学计算、工业仿真等传统高性能计算领域的系统只占25%,这说明高性能计算应用领域呈现扩大化趋势。此外,信息安全首次作为单独应用领域,共产出5套上榜系统。

  高性能计算应用的扩大化与飞速发展的互联网用户密切相关。今年高性能计算 TOP100中,57%的2014年新增系统部署于互联网公司,其中明确部署于百度、阿里、腾讯这三家企业的就有20套,另外部署在电信领域的7套系统其实也是跑互联网应用。

  不过,对于部署在互联网的大机器是否属于高性能计算系统,在高性能计算界其实经过了激烈争辩。一些高性能计算专家认为从应用来看互联网公司的系统不可能进行科研方向的高性能计算,所以不宜纳入HPC TOP100榜单,然而中国计算机学会高性能计算专业委员会(以下简称“高专委”)的专家从孙凝晖主任到张云泉秘书长均认为应对互联网应用采取开放的态度:“鼓励大家在新的行业、新的领域去应用高性能计算,让高性能计算更加走向普罗大众。”

  尽管高性能计算应用领域有所扩大,但高性能计算应用水平依旧是中国高性能计算最主要的短板。张云泉谈起了一则轶事:当天河二号第二次摘得世界高性能计算 TOP 500冠军之后,美国的高性能计算界‘急’了,他们举行了专门的研讨会,探讨中国高性能计算水平是否已经超过美国。而张云泉作为中国高性能计算专家代表还全程参与了此次会议,他表示,该研讨会结论是,中国高性能计算水平目前还落后美国十年。

  “只有当跑在装载有中国自己研发的CPU和系统软件的高性能计算机上的,中国自己开发的高性能计算应用获得戈登贝尔奖,那美国人真该着急了。因此我们呼吁国家未来要加大对高性能计算软件与应用的投资。”张云泉说。

  同时,就高性能计算应用开发而言,不同领域的专家提出不同观点或解决之道。

  例如,北京大学信息学院计算机系副系主任、百人计划特聘研究员、博士生导师陈一峯强调,高性能计算应用开发必须要采用多学科交叉。“必须是应用领域专家与计算机专家共同研究新的统一物理模型、计算方法、计算机算法和系统优化算法,一定要多个学科坐在一起,才能做,要不然根本想不到特别好的解决方案。”陈一峯说。

  在英特尔数据中心事业部技术计算部、技术计算云和客户端总经理Frank Soqui看来,高性能计算系统的平衡性非常重要,即我们在开发和优化高性能计算应用时,要在计算能力、内存、文件系统存储以及通讯之间实现有机的平衡,即实现“高性能计算代码的现代化”。此外,英特尔提供许多工具来帮助开发者降低开发的成本,提升开发的效率,如VTune、Thread Profiler等等。而且,英特尔尽可能提供融合的硬件平台。从编译器的角度去把指令集的不同给屏蔽掉,让编译器自己能够捕捉硬件平台不同来自动的适应。

  当然,还有一些机构或公司是致力于帮助实际用户用好现有的机器、用好现有的应用。例如曙光有一支专门的团队,就是为用户提供高性能计算应用优化服务,帮助用户更好地用好更加高效地使用高性能计算服务。