工作站化身超级计算机，英伟达新一代GPU剑指深度学习和虚拟现实_虚拟现实_智能设备_中国计算网——工业互联网一站式服务平台—

正如英伟达所言，这款产品会很受计算机用户欢迎，他们对此很有信心，理由也很充分。Tesla P100 已经成了神经网络程序员中的抢手货，现在，研究人员们又有了适合工作站的显卡。

与此同时，该产品的第二市场也是传统的高端 CAD/CAE 市场。对于那些需要快速 FP64 性能和 ECC 存储器的工作站显卡（为了实现最大的精确性和可靠性）的特别用户来说，Quadro GP100 是第一个自 K6000 后提供此种功能的 Quadro 显卡。可以说，这是一个利基市场，因为几乎所有的 CAD 用户都不需要那种可靠性，但是，对于那些从事复杂工程模拟之类工作的用户来说，这个产品非常具有吸引力（更别提这是英伟达的又一个利润市场了）。满足这一市场需求也让 Quadro GP100 显得与众不同，因为这是唯一的一款开启图形功能的 GP100 显卡。

不过，当涉及到图形工作载荷时，Quadro GP100 和 P 6000 之间的区别就变得很模糊了。Quadro P6000 能够达到 12Tflops 的 FP32，而 GP 100 的描述是「大于 10 Tflops」, 同样 Quadro GP100 的纹理吞度量大约能达到这个数字的 83%。当然，纸面性能并非全部，但是，在纯信号吞吐限制场景下，P6000 的速度会更快。这也是更加紧凑（以及可制造）GP102 较之庞大的 GP100 的优势所在。

这里，一个出其不意的设计是 HBM2 存储器以及相关的 ROPs。英伟达正在专门兜售 Quadro GP100，在合适的适用场景下，能提供最快的诠释性能。英伟达并没披露 Quadro GP100 的官方存储频率，不过，如果类似 Tesla 对应的产品，那么，每秒达 720G，Quadro P6000 仅达每秒 432G。加上 ROP 计数上的优势——英伟达仍然没有披露 GP100 的 ROP 计数，不过，根据我们对 GP102 架构的了解，128ROP 的猜测是靠谱的——而且，Quadro GP100 纯像素处理能力要比 P6000 强劲 60%。考虑到 CAD/CAE 任务非常依赖于像素处理能力，对于某些 Quadro 用户来说，这是一个摸得到的优点。

它的一个缺点是存储容量。虽然由于 GDDR5X 更好的实际容量 Quadro P6000 能提供 VRAM 24 GB，但和所有的 GP100 产品一样，Quadro GP 100 最多是 HBM2 16GB。

这意味着对大数据集用户而言，单个 Quadro GP100 是好的选择，只是比 P6000 能获得的容量更小一点。值得一提的是，英伟达正在兜售 NVLink 帮助解决容量问题，但或许这种问题根植于计算，而非图显中。

3/4 首页上一页 1 2 3 4 下一页尾页