天河二号再登顶 微异构解HPC系统级挑战

  近日,最新全球超级计算机500强榜单公布来自中国的“天河二号”,以比第二名美国的“泰坦”快近一倍的速度再度登上榜首,美国专家预测,在一年时间内,“天河二号”还会是全球最快的超级计算机。

天河二号再登顶 微异构解HPC系统级挑战

  天河二号之所以有如此优异的表现与其系统配置息息相关。这套系统采用了3.2万颗Intel Xeon E5-2692 v2 2.2GHz 12核心处理器、4.8万块Xeon Phi 31S1P 57核心协处理计算卡、312万个计算核心,使得其运算速度每秒高达54.9千万亿次浮点。

  "微异构"夺冠 预示高性能未来发展趋势

  高性能计算一直以来都是人们比较关注的领域,其作为科学研究的重要手段被广泛应用于分子物理、分子生物学、高能物理、石油勘探等领域。例如:我们可以利用高性能计算来设计出阻力最小、最省油,但是抓地能力更好、更安全的汽车。

  因此,高性能计算的精确度和效率是不断推动工业、科学研究进步的重要因素。例如本次夺冠的“天河二号”的计算能力是2012年11月TOP500榜单中冠军的计算能力的两倍,这意味着相同的计算工作天河二号可以缩短一半时间完成。

  为何天河二号会有如此大的提升呢?这主要是“天河二号”采用了英特尔至强处理器+只能融合协处理器所构成的“微架构”计算系统。该系统即具有多种类型、可提供计算力的硬件架构,但却由通用编辑模型予以支持,简化开发和优化过程。这使得“天河二号”成为了最具能效的系统之一(系统总功率为17.8兆瓦)。

“微异构”预示未来  HPC面临系统级挑战

  “微架构”计算系统。

  如今越来越多的高性能计算系统开始采用异构模式来解决冰箱计算的任务。但主要矛盾是编辑适用于这种异构计算环境的程序,一方面要尽可能好的利用GPU的并行管线,另一方面还要协同调度好CPU的计算资源,这也是很多超算中心在异构模式方面由于的原因。天河二号为“微异构”这种模式做了榜样,一方面用户至强融核协处理器实现了大规模并行计算,另一方面由于至强融核是x86架构,极大的简化了开发和系统优化过程。如今英特尔至强处理器和英特尔至强融核协处理器已发展成为一个强大的组合,在全球最快的多个超级计算机中得到了广泛采用,至今已经在所有超级计算机 500 强提供的聚合性能中占据18%的份额。

  第2页:HPC的系统级挑战

  HPC的系统级挑战

  经典的计算机科学课程告诉我们,如果想要发挥一个计算系统的最大的性能,就必须要从各个方面消除系统的瓶颈,计算瓶颈、I/O瓶颈以及软件瓶颈是最主要的瓶颈。对于高性能(HPC)领域来说,由于主要采用的是计算集群模式,所以需要总体的去衡量整个系统的瓶颈和效率。

天河二号再登顶 微异构解HPC系统级挑战

  超算性能瓶颈

  计算瓶颈就是核心的问题,传统堆砌CPU的方式由于机架密度和功耗等方面的限制难以大幅度提升,"天河二号"也只有3.2万颗至强处理器,而针对并行计算的至强融核协处理器数量则达到了4.8万科,表明未来高性能计算将越来越多的采用这种"微异构架构",从而解决日益攀升的计算资源需求,使其不再是瓶颈。

  I/O方面的瓶颈分为两个部分,一是在节点内的I/O,而则是节点间跨机架的I/O瓶颈。英特尔将内存控制器、PCI-E控制器等放入CPU,用顶尖的半导体科技制造SSD来加速节点内的存储读写速度和随机数据IOPS。对于节点间的I/O,英特尔的万兆以太网以及郑州发展的贵光子技术都在全力加速计算节点间的I/O能力。

  硬件提升对于软件开发和系统优化都带来极大的影响,“微异构”由于拥有相同的x86架构,可以在相同的编程环境下,甚至几乎不用改动原有代码情况下酒可以顺利运行。英特尔即将推出的代号为"Knights Landing"的新一代融核主处理器则可以无缝运行原生应用。

  “微异构”能够给高性能计算领域消除计算瓶颈,用节点间的高度集成和节点间的告诉网络来消除I/Oing就,那么用x86架构下的软件来定义整个系统,才是所有超级计算机的终极任务--让应用真正无缝、高速的跑在系统上。我们也期待微异构在未来的超级计算机系统上发挥越来越重要的作用,毕竟高性能领域对于任何领域来说都是极其重要的。