14万3千枚CPU:探访中国首台自主超级计算机

拥有为14万3千枚16核CPU;

存储容量高达2PB(1PB等于100万GB)

最高带宽达到69.6TB/s(1TB等于1000GB);

每秒峰值运算达1.07千万亿次,相当于20万台普通笔记本同时运算能力;
……

探访中国首台自主超级计算机

显然,这不是一台普通的电脑,这是中国首台自主研发CPU和底层系统的千万亿次超级计算机神威蓝光

10月13日,带着几分好奇,电脑报记者来到济南超级计算机中心,第一次了解到神威蓝光的诸多细节,也见到了与这台国产超级计算机朝夕相处的一群科学家。

走进超级计算机的心脏

没有想象中巨大,神威蓝光就是一个放大的“0”躺在机房里,走进它,如果不是旁边一排商业服务器的噪声提醒,从外面封闭的外壳难以察觉它的运行。

国家超级计算济南中心陈德训研究员像魔法师为记者打开了三扇门。

第一扇“0”型头部的一扇门,映入记者眼帘的是晶莹透明、手指粗细的水管,有序地排列在两排机架上,与地板下的制冷系统相连,用手摸一下这些水管,都是冰凉的感觉。

第二扇门打开,是配列整齐的CPU,每排8颗CPU,128个核,一个机架上是一万亿次的计算能力。

第三扇门打开的时候,就是一个空的椭圆形小房间,“这里有什么宝贝?”

“进来吧,感受一下安静。”陈德训邀请记者走进蓝光超级计算机的内部,“环形墙”原来是9个计算机仓和2个网络机仓,除了网络连线上的指示灯闪烁,这里简直可以当着是静修的空间。

“这就是神威蓝光的主机部分”,总工程师周明忠研究员说包含14万3千个核的主机只占用60平米的机房,与其庞大的计算能力相比,确实是小巧玲珑

神威蓝光从2011年9月整个系统安装加电测试以来,一直就是保持24小时的开机运行状态。

“关键是主机的CPU和底层软件系统全部是国内自主研发生产的,使中国成为继美国、日本之后,世界上第三个具有独立研发千万亿次超级计算机的能力的国家。”陈德训和所有研究员都倍感自豪。

最神秘的神威蓝光的CPU,是全球第一颗16核CPU,比AMD的要早6个月,并行操作系统、虚拟机管理器、多核编译器、并行编译器、海量并行文件系统、多核数学库则是自主研发的软件成果

此时是10月13日中午12:08,从主机房外监控室的屏幕上,看到此刻正忙着的CPU是7760个,系统为正在运行的项目配置了8704颗CPU,屏幕上绿色显示闲着的CPU主要分布在第3号机仓。

“正在运行的是什么计算?”

“我们并不清楚每个计算项目的具体运行内容,监控主要是看机器性能配置,发现有问题会及时自动处理。”

“通常一次运算要多少时间?”

“一天的计算时间是最短的项目,项目一周左右的计算时间比较普遍。”

“怎么知道在这里跑的运算项目没有暗藏恶意代码?”

“运行前有一套安全检测程序会保证机器安全”研究员对记者的疑问一一耐心解答。