百度将推出超级计算机 位列全球前十

继天河二号后,全球超级计算机研发再爆大新闻。据《观察者网》得到的消息,中国最大搜索引擎巨头百度将推出超级计算机。

《华尔街日报》周二报道,百度(Baidu Inc., BIDU)称已在备受关注的人工智能基准测试中取得了全球最好的结果。这家中资搜索巨头的研究人员称,百度有一个秘密武器,这就是超级计算机Minwa。

Minwa扫描了拥有100万余张图片的数据库ImageNet,并“自学”如何将这些图片按照预先确定的约1,000个不同类别进行分类。这意味着要了解法式面包与烘肉卷的区别,而且还要应对更复杂的挑战,比如区分湖地梗与卷毛猎狐梗。

未来18个月,百度计划构建一个能够每秒进行7千万亿次计算的更庞大设备。如果成功,将足以使该系统成为全球性能最强大的10台超级计算机之一,但其所进行的运算的复杂程度仍不及全球顶级超级计算机。

此前,百度CEO李彦宏多次谈到人工智能。除了两会提交人工智能提案后,在博鳌论坛上,李彦宏和微软创始人比尔.盖茨及特斯拉电动车创始人马斯克对话时,李彦宏说对于百度就是希望未来能够利用技术,更好的为用户服务。

4月底在证监会演讲时,李彦宏坦言,过去十几年我们做的最重要的事情,就是“连接人与信息”。并说道,现在和未来百度可以满足更多的需求,比如我现在要去哪个机场,下午4点给我定好;晚上8点半我要看《速度与激情7》,要第五排的座位,给我定好;后天要去我出差,要住什么酒店,这些全部都可以做到,它可以理解你的话,它可以把这事办了,它可以无缝地把线上线下各种各样的东西联系起来。

超级计算机定义

指能够执行一般个人电脑无法处理的大资料量与高速运算的电脑,其基本组成组件与个人电脑的概念无太大差异,但规格与性能则强大许多。现有的超级计算机运算速度大都可以达到每秒一兆(万亿,非百万)次以上。

目前最快的超级计算机

截止到2014年11月,世界上运算速度最快的超级计算机是,由中国人民解放军国防科学技术大学等单位研制的天河二号,它每秒能完成5亿亿次运算。双精度浮点运算峰值速度达到每秒5.49亿亿次,Linpack(国际上流行的用于测试高性能计算机浮点计算性能的软件)测试性能已达到每秒3.39亿亿次。

过往的超级计算机

2009年10月,中国研制的第一台千万亿次超级计算机在湖南长沙亮相,全系统峰值性能为每秒1.206PFlops。这台名为天河一号的计算机位居同日公布的中国超级计算机前100强之首,也是当时世界上最快的超级电脑。天河一号的研制成功使中国成为继美国之后世界上第二个能够研制千万亿次超级计算机的国家。

2008年11月,IBM的Roadrunner成为当时最快的超级电脑,运算能力为1.105PFlops。

2008年11月16日,美国Cray超级电脑公司推出Jaguar系列,运算能力为1.059PFlops,采用45376颗四核心的Opteron处理器,362TB的存储器,传输总带宽284GB/Sec,硬盘容量超过10PB,内部的数据总线带宽532TB/Sec。这台电脑将放置在美国的国家高速电脑中心,并开放给各界有需要的团体申请使用。

2007年11月,IBM的BlueGene/L,运算能力为478.2 TFlops,安装了32768个处理器。它是PowerPC架构的修改版本,正式运作版本被推出到很多地点,包括罗兰士利物摩亚国家实验室(Lawrence Livermore National Laboratory)。

在Blue Gene/L之前,最快的超级计算机是日本电气株式会社在横滨地球科学学院的地球模拟器。它由640个特别设计的8阶矢量处理器根据NEC SX-6架构所组成的丛集,使用UNIX的修改版本。

在地球模拟器之前,最快的超级计算机是美国加州罗兰士利物摩亚国家实验室的ASCI White,它的冠军位置维持了2.5年。

速度单位

超级计算机速度以每秒浮点运算次数"FLOPS"(floating-point operations per second)来作量度单位,常见的表示电脑中的峰值或速度用的单位英汉对照如下:

一个MFLOPS(megaFLOPS)等于每秒100万(=106)次的浮点运算

一个GFLOPS(gigaFLOPS)等于每秒10亿(=109)次的浮点运算

一个TFLOPS(teraFLOPS)等于每秒1万亿(=1012)次的浮点运算

一个PFLOPS(petaFLOPS)等于每秒1千万亿(=1015)次的浮点运算

一个EFLOPS(exascaleFLOPS)等于每秒100亿亿(=1018)次的浮点运算

此外,由于浮点积和熔加运算或乘积累加是两次的浮点运算(每条FMA指令包括加/减及乘),因此当处理器支持FMA指令时,峰值是两倍每秒所能运行FMA指令的数目。

设计

超级计算机的创新设计在于把复杂的工作细分为可以同时处理的工作并分配于不同的处理器。他们在进行特定的运算方面表现突出,但在处理一般工作时却差强人意。他们的数据结构是经过精心设计来确保数据及指令及时送达——传递速度的细微差别可以导致运算能力的巨大差别。其输入/输出系统也有特殊设计来提供高带宽,但是这里的数据传输延迟却并不重要——超级计算机并非数据交换机。

根据阿姆达尔定律,超级计算机的设计都集中在减少软件上的序列化、用硬体在瓶颈上加速。

挑战与科技

超级电脑通常产生大量的高热,冷却超级电脑是一个很大的问题。

因为数据传送的速度不能比光快,几米的距离导致了几十纳秒的延迟,而克雷著名的环型设计保持了最短距离。

超级电脑在短时间内消耗及生产大量的数据,需要投入很多资源确保资讯妥善传送及访问。

因超级计算机而开发的科技:

矢量处理器

水冷技术

非均匀访存模型

处理器技术

矢量处理因超级计算机而创建并用于高性能运算。矢量处理技术后来被用于普通电脑内的信号处理架构及单指令流多数据流,例如:电视游乐器及通用图形处理器等。