美国封锁对华超算技术出口:出什么事了?(上)

美国封锁对华超级计算机关键技术出口的消息,让超算这个词汇又成了媒体关注的焦点。

虽然国产超算“天河2号”已经数度夺得全球性能冠军,但是为之自豪的网民还很少对“超级计算机”这个概念有比较深入的了解。本文将先为大家介绍超级计算机相关的背景知识,而续篇则会探讨美国技术封锁政策对我国超算发展的影响。

什么是超算?

超级计算机,又称高性能计算,英文名High Performance Computing,简称超算/HPC。HPC是为了解决工业界对大规模计算能力的需求而诞生的技术,现代超算本质上是将大量配置接近普通家用电脑/商用工作站的主机通过高速网络连接起来的主机集群。它运行的是专用操作系统,每台主机是一个运算节点;大量节点的运算能力叠加起来,就获得了远超单台或几台普通PC的计算能力。

超算的技术特点

经常在超算相关的新闻下面看到这样的评论:“这么强,跑xxx游戏卡不卡?”普通消费者对“运算速度”的概念通常就是玩一些大型游戏有多少帧率、画面细节能达到什么档次。有趣的是,超算执行的任务与3D游戏有不少相似之处。

计算机世界中,“计算”可以分为整数和浮点计算两大类。8X4是整数运算,而1.5912/0.4就是浮点计算。我们常见的大多数程序都是以整数计算为主,辅之以少量浮点部分;但3D游戏、图像渲染、视频特效这类工作则会大量应用浮点代码。

在科学和工程领域常见的计算任务都是偏浮点化的:典型如大气模拟、材料应力计算、蛋白质分子模拟、地质模型分析等。这些领域中整数运算所占的比例较小,与我们常见的PC程序有较大差异。

浮点运算任务的一大特点是很容易高度并行化。简单来说就是一段计算可以拆分给许许多多的计算核心来完成,不像整数计算那样很多时候只能分给少量几个核心。另外,密集浮点程序可以大量使用高级浮点指令—例如AVX、FMA等来明显提升运算速度。相比之下一般消费者使用的程序往往只能用到老旧的SSE、SSE2,不太容易从新指令中获得加速效果。

因为上述特点,高性能计算领域的应用可以很容易地从CPU的浮点运算能力改进中得益。下图是Intel几代Xeon CPU的理论浮点性能对比,可以看出受益于高级指令的增加,每代新品的性能都提升1倍以上;我们普通消费者很难感受到这么大幅度的进步,但科学和工程计算程序就获益匪浅。

5526fdbf477d7.jpg

偏重浮点性能、可以大规模并行化的特点使科学计算应用很适合跑在GPU上。GPU可以看作是有很多小核心的一种CPU,牺牲整数性能和单核心性能换来整块芯片超强的浮点性能。CPU和GPU联合执行科学计算的方式被称为异构计算,最近几年异构计算开始逐渐在业界推广。

除了执行运算的CPU、GPU核心,超算的另外两大关键技术是内存和互联网络。高性能计算任务通常需要大量的内存,而且所需的空间随计算核心数量的增多而增加;此外,这些内存还要有很高的带宽来迅速将数据传递给处理器核心。互联网络则是将成千上万的主机搭建成超算系统的关键,主机数量越多,对网络的带宽、延迟和稳定性要求就越高。

超算技术发展现状

从前面的介绍我们可以知道,超算需要的是浮点性能很强、内存带宽和容量很高的计算芯片,以及高性能的大规模互联网络。高性能芯片的技术被四大巨头垄断:Intel、IBM、Nvidia和AMD。其中,Intel和IBM一方面生产CPU,另一方面研制出了类似GPU的超多核心芯片。例如Intel的新一代Xeon Phi处理器就是将数十颗特别加强了浮点性能的Atom核心集成到一起,配上带宽达到数百GB/s的3D封装内存制造而成的。一颗新版Xeon Phi的性能达到每秒2万亿次浮点运算,相当于最快的Xeon CPU的3倍。Nvidia和AMD则在自家GPU的基础上生产专用计算卡Tesla和FirePro,其浮点性能也达到2-3万亿次每秒的水平。

5526fde31eb31.jpg

由于制造技术与成本的限制,Tesla和Xeon Phi这样的芯片的内存不能做到很大容量,无法执行那些需要庞大内存空间的代码,这也限制了这类芯片的普及率。但由于这些芯片的性能相比一般CPU有明显优势,且几大企业都在努力解决内存空间的问题,未来它们会是业界的主流选择。Intel希望自己的Xeon Phi在未来能一统天下;Nvidia与IBM合作,将推出Power CPU+Tesla 计算卡的异构解决方案;AMD则力推自家的HSA异构方案,希望Opteron CPU+FirePro计算卡的组合能占据一席之地。目前来看Intel的优势比较大,而Nvidia/IBM的联盟也能拿下一定的份额。

互联网络方面的技术不像计算芯片那样高度垄断。目前有不少企业都在提供超算网络解决方案,我国在这方面也具备世界一流水平。最先进的超算网络可以让数万计算节点以高达100Gbps的带宽通信,同时保证稳定性和低延时。

超算对国家的意义

一如前文所述,超算技术主要是服务工业和科学研究的。强大的计算能力对企业、学校和国防研究都有很大的帮助,甚至可以说是不可或缺的。当年美国宣布终止核试验,其底气就是超算模拟核试验技术已经足够成熟。由于投入巨大、回报周期较长,各国的超算项目主要由政府实施或资助。如今,超算技术和资源水平已经成为一国科研实力的重要指标之一。

中国的超算技术近年来发展迅速,曙光、天河前后多次登上全球超算性能排行榜冠军。如今美国宣布对华超算技术禁运,无疑是感到了中国在这一领域的威胁。那么美国的禁运政策将对中国有什么影响呢?请看下一篇文章的具体分析。