Intel:测试结果显示GPU对通用计算加速很有限

Intel、NVIDIA有关CPU、GPU孰优孰劣的争执已经来来回回了很长时间,最新的争论焦点是GPU通用计算加速的效率到底有多高。

在法国圣马洛举行的计算机架构国际研讨会上,Intel的十二位研究人员联合提交了一份论文,通过对比处理器、显卡的实际效率,指出GPU通用计算加速并没有宣传得那么神乎其神。

Intel在论文中表示,他们对一系列重要的吞吐计算内核进行分析后发现,其中很多都支持并行运算,非常适合多核心CPU或者GPU,但是过去几年来,有很多研究声称GPU运行这些内核的速度可以达到多核心CPU的十倍乃至上百倍,因此Intel找来了十四款并行计算内核,使用 Core i7-960、GeForce GTX 280进行对比测试,操作系统为SUSE Enterprise Server 11,搭配CUDA 2.3开发套件,结果发现GPU的效率只比多核心CPU高出平均2.5倍,最多的也只有14.9倍。

Intel、NVIDIA争执GPU通用计算效率

Intel、NVIDIA争执GPU通用计算效率

NVIDIA公司发言人Andy Keane随即回应说,这并不是Intel第一次提出这种测试和论调,但是Intel测试使用的内核很可能并没有针对上一代GeForce GTX 280显卡进行任何优化,他们还有更新、更高效的GeForce GTX 400系列,而且Intel并未公布他们到底运行的是什么代码。

他还强调说,确实并非所有应用程序都能从GPU身上获得巨大加速,有些只有略微提升,但一百倍乃至更高的效率提升是数百开发人员都见识过的,事实上 CUDA并行计算架构诞生才不过三年,已经有了数百种消费级、专业级和科学应用可以借助NVIDIA GPU获得数十倍乃至上百倍的性能提升。

Intel公司的一位发言人也迅速出面,声称NVIDIA只看到了论文的一小部分,并未理解整个测试的过程和意义,GPU内核性能也确实经常被夸大其词。

他声称,Core i7、Xeon这样的通用处理器才是绝大多数应用的最佳选择,不管是消费客户端、一般服务器还是高性能计算,因为Intel架构编程模型人所共知,还有成熟的配套开发工具,而且在大范围的工作环境中都有很好的性能表现,而不是仅限特定的应用内核。

微信关注公众号“cncompute_com ”,为您奉上最新最热的计算头条资讯,干货满满。