定制化CPU！英伟达或推64位ARM核心产品_计算设备_计算头条_中国计算网——工业互联网一站式服务平台—

　　早在2011年1月，NVIDIA就宣布将基于64位ARM指令集自主研发的处理器架构，和自家GPU组成完整的平台，但三年间几乎没有任何细节披露。在2013年英伟达(Nvidia)GTC活动上，英伟达(Nvidia)已经透露出基于“Denver”项目的首款商用芯片Parker预计2015年上市，该产品将搭载2014年版Maxwell GPU以及全新的64位定制化ARM处理器。

　　近日HOT CHIP大会上，英伟达(Nvidia)揭开其定制化64位ARM核心处理器神秘面纱，这款代号“丹佛(Denver)”的处理器采用微指令(microcode)架构，具备新一代执行优化功能。

　　定制化CPU！英伟达或推64位ARM核心产品 Android平台产品

　　该款Nvidia预定在今年推出的是Tegra K1升级版双核心处理器，主要是针对平板设备应用，32位版本Tegra K1目标应用是Android平台产品。Nvidia声称，64位的Tegra K1将可让移动设备具备PC等级的性能，支持游戏、企业应用等，基准测试数据显示Denver效能与英特尔Haswell处理器相当，且超越苹果A7系列处理器10~25%。

　　配备64位ARM通用核心的GPU

　　不过Nvidia并没有提供Denver与ARM的标准64位A57核心之性能比较。而在针对服务器与网络设备应用，AMD已经开始提供采用A57核心的处理器样品，而Applied Micro也推出了定制化64位ARM核心的样品，英伟达在64位方面并没有提供相关信息。

定制化CPU！英伟达或推64位ARM核心产品

　　Nvidia GPU路线图(来源eetimes网站)

　　对于英伟达而言，下一代显卡核心架构Maxwell是重点，是英伟达名为“丹佛计划”的一个关键项目，而其中最为重要的是Maxwell将是第一个配备64位ARM通用核心的GPU核心，据悉计划在2014年推出Maxwell将支持可GPU与ARM CPU之间共享虚拟内存的能力。

　　但是，因为缺乏标准与定制化64位ARM核心处理器的性能测试比较数据，Denver能否提升在移动设备应用领域的份额尚不明朗，在该领域落后Qualcomm。

　　第2页：Denver处理器核心架构

　　基于“Denver”项目Nvidia芯片产品细节并未透露过多，但从发展蓝图的一些愿景，英伟达下一重大市场动作是即将推出Logan，这款Tegra 5 SoC将针对智能手机和平板电脑的芯片中整合Kepler GPU，首个基于ARM SoC支持其CUDA软件环境，CUDA并行运算原本仅用于基于x86服务器和超级计算机中。

定制化CPU！英伟达或推64位ARM核心产品

　　Tegra K1处理器

　　从现有资料了解，NVIDIA最新公开的Tegra K1双核处理器，采用两组Denver处理器心、64位ARMv8架构、最多能执行7个指令集，最高运作频率2.5GHz，128+64KB L1高速缓存令，除了能支持更多RAM的数目外，整体效能也大幅提高，而且两款处理器的针脚亦相互兼容。

　　同时，Tegra K1 Denver处理器同样内建 NVIDIA Kepler架构的192 CUDA核心GPU，其功耗表现却与上代产品相同，特别图像处理器性能上优化。此外，Cahce方面其整合128KB及64K的一级指令及数据缓存，并加入2MB二级缓存，相对32bit版本效能倍级提升。

　　与此同时，最新Denver架构中加设Dynamic Code Optimization技术，主要常用将应用程序软件优化并转译，提升指令的执行效率。据NVIDIA表示，该优化程序链结了相关的例行程序(routines)，并应用了128MB的主存储器，在操作系统开机之前进行安全分割，优化程序可带来两倍以上的速度提升。

　　如果Denver真是一个代码融合/模拟CPU产品，那么64位版本的Tegra K1将是一个全新的芯片。事实上，ARM仍持续寻求混合搭配32位与64位核心的解决方案。作为英伟达尚未指定应用市场领域，尽管Denver的特点包括重复使用内存管线(pipeline)以统整流量，以及可补偿高速缓存遗漏的预先撷取(pre-fetch)功能，但无论是移动或服务器产品上，芯片仍然需进行大量的测试和优化。

　　Tegra K1预计将在2014年下半年上市。