在中国,谈到高性能计算机业界第一个想到的便是曙光公司。从曙光1号到曙光星云,曙光公司一直在高性能计算机的研发和应用上保持着领先优势,并在市场上获得了广泛认可。
在35届中国超级计算机TOP500榜单里,曙光公司不仅让业界为之一震,更让世界为之一震,曙光星云以其峰值理论运算能力2.98 PFlop/s排在了世界第二,仅次于“Jaguar(美洲豹)”,这是中国超级计算机在TOP500榜单里的最高排名。这不仅刷新了中国高性能计算机的最高速度,同时还意味着中国高性能计算机产业实现了超千万亿次计算技术的自主产业化。
据悉,曙光星云系统已经成功应用在曙光公司全国布局的云计算中心建设中,以“中国速度”推动中国云计算发展进程,加速中国云计算进入应用时代。
以曙光TC3600刀片为核心 高配置星云成就“中国速度”
2010年6月,经历了十万亿次与百万亿次超级计算能力的测试考验,中国首台实测性能超千万亿次的超级计算机曙光星云高性能计算机系统正式发布,这是中国超级计算机史上值得纪念的历史性时刻。中科院院士李国杰这样评价星云系统:“从每一个刀片到浮点加速卡,以及整个软件系统,全部都是自主创新的成果,星云系统的组装密度已经超过了世界上任何一台高性能计算机。”
据悉,星云系统核心部件采用的是曙光公司自主研发的最新一代刀片服务器曙光TC3600,也是全球第一款符合SSI规范的刀片服务器系统。曙光TC3600刀片服务器以高性能计算、WEB基础架构、虚拟化为主要应用目标,融入了诸多先进的设计理念和技术特性,是业界领先的最新一代符合开放性标准的刀片服务器产品,它拥有高性能、高密度、可伸缩、按需配置、方案灵活等设计特点,可以满足用户多样且动态变化的应用需求,同时它还具备企业级产品的RAS特性,可满足政府、电信、金融、教育、互联网等关键用户的需要。
从运算能力上来看,星云系统峰值为每秒300万亿次云系统峰值为每秒3000万亿次(3PFlops),实测Linpack值每秒1271万亿次(1.271PFlops),是中国第一台、世界第三台实测双精度浮点计算超千万亿次的超级计算机。相比“Jaguar(美洲豹)”采用了224162个处理器核心和IBM“Roadrunner(走娟)”的122400个处理器核心,名列第二的“星云”则只用了120640个处理器核心。同时,星云超级计算机也是目前国内最“绿色”的超级计算机,它的单位耗能所提供的性能达到了4.98亿次/瓦。
正如高性能计算领域的技术人员所认为的那样:“尽管CPU是计算机的核心,但并不是简单地把众多CPU堆起来,就能搭成一架超级计算机,这需要架构设计、软件设计等很多技术。”而星云超级计算机采用自主设计的HPP体系结构,处理器是X5650,并且采用了Nvidia Tesla C2050 GPU做协处理,由4640个计算单元组成。它采用了高效异构协同计算技术,系统包括了9280颗通用CPU和4640颗专用GPGPU组成。计算网络采用了单向40Gbps QDR Infiniband技术,核心存储采用了自主设计的Parastor高速I/O系统。同时包括自主研发的QDR IB高速交换模块(HSSM),突破高速信号传输技术,是系统高速通信的核心部分。独创的IOE设计,大大提高了系统的可扩展性。