超算开启E级时代 曙光自主研发实力先行

  随着第31届国际超算大会(ISC2016)在德国法兰克福落下帷幕,全球超算TOP500榜单也迎来新一轮的更新。由我国自主研制的“太湖之光”取代“天河二号”成为世界最快计算机,并将最快计算机的计算速度刷新到93PFlops(每秒9.3亿亿次)。

  核心处理器全国产化的“太湖之光”,着实让国人为之一振。其接近100PFlops的运算速度,也宣告了人类“建造十亿亿次超级计算机”的目标达成,高性能计算正处于从P级(1015Flops)迈向E级(1018Flops)的发展阶段。

  E级超算:“下一顶皇冠”

  E级高性能计算机(简称“E级超算”)是指每秒可进行百亿亿次数学运算的超级计算机,被全世界公认为“超级计算机界的下一顶皇冠”。

  E级超算将在解决人类共同面临的能源危机、污染和气候变化等重大问题上将发挥巨大作用。中国计算机学会高性能计算专委会秘书长、中科院计算所研究员张云泉指出,E级超算可以应对一些具有重大计算的需求,如全球气候变化模拟、天体物理大数据的处理(如SKA项目)、模拟宇宙的演化、模拟新型材料及核武器等。同时,除了科学计算,它也将在深度学习、大数据、云计算等领域发挥重大价值,帮助提高人们对各领域日益剧增的海量数据处理利用的能力,并从中发现新事物、新规律和新机会。另外,通过研制E级超算,还可以对上下游的核心技术和关键部件的研发、应用环境和软件的孵化产生积极的促进作用。因此,E级超算具有极高的科学、社会、经济和产业生态价值。

  作为大国综合实力的象征,尤其是衡量一国科技创新实力的标志,E级超算已成为当前各国竞相角逐的战略制高点。美国、欧洲、日本等国都提出了自己的E级超算研发计划,中国也将百亿亿次超级计算机的研究写入了国家“十三五”规划中,并计划于2020年对外发布。

  多个挑战有待破除

  随着高性能计算机运算规模的增加,其效能的进一步提升却遇到了挑战。张云泉研究员介绍说,按照国际上公认的标准,E级超算的性能与功耗比应不宜超出20MW(随着国际上对E级超算建造难度认识的增加,现在全球共识是30MW)。按照这一标准,即使是能耗比较好的“太湖之光” 也还相差一个量级。

  E级超算不单纯代表着运算速度达到了Eflops,而是代表着系统整体设计质的突破和性能的综合提升。因此,建设E级超算不仅有效能上的挑战,而是在生态环境、可靠性、应用编程、存储、多领域应用的融合等多方面都面临着很大挑战,亟待需要攻克。

  尽管如此,世界各国仍预计E级超算将在2020年左右实现。张云泉介绍说,欧盟、日本等制定的E级超算计划将时间表定在了2020年,中国也希望在“十三五”规划收官之时实现E级超算系统。

  自主实现,原型系统先行

  采用“中国芯”的“太湖之光”成为我国自主研发E级超算的希望。张云泉认为,“太湖之光”的成功已经为我国向1000P迈进打下了一个坚实的基础。

  按照一般科研规律,在类似大科学装置正式开启研发日程之前,原型系统等预研项目非常必要。在最新公布的国家“十三五”高性能计算专项课题中可以看到,科技部公示出了3个分别由中科曙光、国防科技大学和江南计算技术研究所牵头的E级超算的原型系统研制项目。据消息人士透露,中科曙光牵头的E级超算原型系统研制项目将于近期举行的曙光技术创新大会(IDIC2016)上正式启动。

  曙光公司和中科院计算所先后研制完成了从曙光1号到曙光6000共7代高性能计算机,掌握了高性能计算机HPP体系结构、高效能刀片服务器、3D-Torus网络、高性能网络交换机、大规模并行存储等一系列核心技术并逐步实现了超算系统产业化,具有强大的研发实力。此次围绕“高性能计算”重点专项和“E级计算机关键技术验证系统”方向的总体目标,将对E级超算的研发展开有益的探索。

  而相信通过作为中国超算三大品牌的曙光、天河、神威的共同努力,并做好技术、人才、资源、经费和材料的储备,我国首先冲击E级超算指日可待。