正如英伟达所言,这款产品会很受计算机用户欢迎,他们对此很有信心,理由也很充分。Tesla P100 已经成了神经网络程序员中的抢手货,现在,研究人员们又有了适合工作站的显卡。
与此同时,该产品的第二市场也是传统的高端 CAD/CAE 市场。对于那些需要快速 FP64 性能和 ECC 存储器的工作站显卡(为了实现最大的精确性和可靠性)的特别用户来说,Quadro GP100 是第一个自 K6000 后提供此种功能的 Quadro 显卡。可以说,这是一个利基市场,因为几乎所有的 CAD 用户都不需要那种可靠性,但是,对于那些从事复杂工程模拟之类工作的用户来说,这个产品非常具有吸引力(更别提这是英伟达的又一个利润市场了)。满足这一市场需求也让 Quadro GP100 显得与众不同,因为这是唯一的一款开启图形功能的 GP100 显卡。
不过,当涉及到图形工作载荷时,Quadro GP100 和 P 6000 之间的区别就变得很模糊了。Quadro P6000 能够达到 12Tflops 的 FP32,而 GP 100 的描述是「大于 10 Tflops」, 同样 Quadro GP100 的纹理吞度量大约能达到这个数字的 83%。当然,纸面性能并非全部,但是,在纯信号吞吐限制场景下,P6000 的速度会更快。这也是更加紧凑(以及可制造)GP102 较之庞大的 GP100 的优势所在。
这里,一个出其不意的设计是 HBM2 存储器以及相关的 ROPs。英伟达正在专门兜售 Quadro GP100,在合适的适用场景下,能提供最快的诠释性能。英伟达并没披露 Quadro GP100 的官方存储频率,不过,如果类似 Tesla 对应的产品,那么,每秒达 720G,Quadro P6000 仅达每秒 432G。加上 ROP 计数上的优势——英伟达仍然没有披露 GP100 的 ROP 计数,不过,根据我们对 GP102 架构的了解,128ROP 的猜测是靠谱的——而且,Quadro GP100 纯像素处理能力要比 P6000 强劲 60%。考虑到 CAD/CAE 任务非常依赖于像素处理能力,对于某些 Quadro 用户来说,这是一个摸得到的优点。
它的一个缺点是存储容量。虽然由于 GDDR5X 更好的实际容量 Quadro P6000 能提供 VRAM 24 GB,但和所有的 GP100 产品一样,Quadro GP 100 最多是 HBM2 16GB。
这意味着对大数据集用户而言,单个 Quadro GP100 是好的选择,只是比 P6000 能获得的容量更小一点。值得一提的是,英伟达正在兜售 NVLink 帮助解决容量问题,但或许这种问题根植于计算,而非图显中。