超算不止是算,曙光补齐中国超算另一短板

  “天河1号、天河2号、太湖之光”这些名字在最近几年频繁的出现在公众视野中,以往并不太受公众注意的超级计算机亦成为人们的兴趣点。而这些名字背后,是最近几年中国在超级计算机硬件方面所取得的卓著成就。

  但随着中国连续多年毫无意外的取得全球超算性能排行榜首位之后,很多人也发出这样的疑问:中国在超算方面的实力真的已经天下无敌了么?

  中国超算的短板在哪里?

  超算是一个庞大的计算机系统,其目的是解决人类在科研当中遇到的各类与计算有关的复杂问题。而更具体来说,中国超算目前所取得的第一仅代表他们在运行测试软件时所展现的性能排名第一,而这也仅是评价一国超算实力的一个方面。实际的情况是,对于这个超算这个庞大的整体来说,中国离世界第一仍存在差距。

  回到问题的本质,超算与所有计算机一样,其本职工作是利用输入的数据经过计算产生数据的输出。而在科研领域,很多问题是没有定论的,一切都要看运算的结果;这个运算结果有时表现为“是和否”,有时则表现为一个庞大的数据集。在很多实际的计算中,研究人员往往要带着满满一旅行箱的硬盘来给超算导入数据,计算完成后,科学家得到的则是另一旅行箱硬盘才能装下的海量数据;而真正的科研结果则需要对这些数据进行分析之后才能得出。

  显然,在于超算相对应的整个科学计算领域,如何处理好大数据是一个相当实际的问题。而实际的情况是,国内之前还没有针对科学计算领域的大数据管理、分析引擎;这也是中国超算在“性能领先”的光环照耀下一个不容忽视的短板。

  而现在,这块短板已经被补齐。

  曙光科学大数据引擎

  无分析不科研。

  现代科学技术的进步以及对未知的探索已经越来越离不开对海量数据的分析。但对于人脑来说,太多的数据显然是无法处理的。如何将数据分析、数据可视化、数据管理的能力从商业市场引入科学计算领域一直是超算领域中的重点研究方向。

%e5%b1%8f%e5%b9%95%e5%bf%ab%e7%85%a7-2016-10-28-%e4%b8%8b%e5%8d%883-47-50

曙光发布国内首个科学大数据引擎

  科学计算领域中大数据引擎要面对的数据量更大、数据精度也非常高、同时也会有不同于商业分析的众多不同数值处理方法;而这也是普通商业数据分析引擎无法套用在科学领域的主要原因。而曙光的科学大数据引擎则针对科学数据的特点做出了特别的优化,能够以更高的性能实现对PB级科学数据的分析和处理。而在数据查询方面,曙光科学大数据引擎更能够在亿级数据库中实现毫秒级的急速查询功能。显然,表现都是传统商业大数据引擎所不具备的。

  除了软件方面,曙光科学大数据分析引擎还将曙光在硬件方面的优势进行了整合。通过引入曙光在超融合、存储和服务器方面的产品经验,曙光科学大数据分析引擎解决方案能够实现计算、存储、分析、运维等流程的一体化,大大提高科研工作的速度。同时,整套系统还具备极强的扩展能力,可构建EB级的单一存储空间,为未来的E级计算打下基础。

  做高性能计算的领导者

  与商业计算领域一样,在高性能计算领域中,制造出最强的硬件并不意味着能够成为这一领域的领导者。而深耕高性能计算领域多年的曙光对这一点深有体会。

  与其他厂商单纯追求超算性能与销量不同,曙光更加注重超算整体解决方案能力的形成。因此,曙光除了在超算硬件领域的持续研发和投入之外还推出了EasyOP运维解决方案、作业调度系统解决方案、机房基础设施解决方案、监控管理系统解决方案等在内的一系列周边解决方案;加之在超算系统计算、存储和网络方面的强大实力,曙光已经形成了全面的高性能计算能力。换句话说,曙光能够为科研单位和企业提供从无到有,从用到管的全套解决方案,让用户在构建超算系统时也能享受到一站式的“交钥匙”体验。而这种全方位的能力才是衡量超算行业领导者的核心指标。

  也正是由于这样的能力,曙光在刚刚出炉的2016中国超算TOP100榜单当中连续8年蝉联榜首。