早在2011年1月,NVIDIA就宣布将基于64位ARM指令集自主研发的处理器架构,和自家GPU组成完整的平台,但三年间几乎没有任何细节披露。在2013年英伟达(Nvidia)GTC活动上,英伟达(Nvidia)已经透露出基于“Denver”项目的首款商用芯片Parker预计2015年上市,该产品将搭载2014年版Maxwell GPU以及全新的64位定制化ARM处理器。
近日HOT CHIP大会上,英伟达(Nvidia)揭开其定制化64位ARM核心处理器神秘面纱,这款代号“丹佛(Denver)”的处理器采用微指令(microcode)架构,具备新一代执行优化功能。
Android平台产品
该款Nvidia预定在今年推出的是Tegra K1升级版双核心处理器,主要是针对平板设备应用,32位版本Tegra K1目标应用是Android平台产品。Nvidia声称,64位的Tegra K1将可让移动设备具备PC等级的性能,支持游戏、企业应用等,基准测试数据显示Denver效能与英特尔Haswell处理器相当,且超越苹果A7系列处理器10~25%。
配备64位ARM通用核心的GPU
不过Nvidia并没有提供Denver与ARM的标准64位A57核心之性能比较。而在针对服务器与网络设备应用,AMD已经开始提供采用A57核心的处理器样品,而Applied Micro也推出了定制化64位ARM核心的样品,英伟达在64位方面并没有提供相关信息。
Nvidia GPU路线图(来源eetimes网站)
对于英伟达而言,下一代显卡核心架构Maxwell是重点,是英伟达名为“丹佛计划”的一个关键项目,而其中最为重要的是Maxwell将是第一个配备64位ARM通用核心的GPU核心,据悉计划在2014年推出Maxwell将支持可GPU与ARM CPU之间共享虚拟内存的能力。
但是,因为缺乏标准与定制化64位ARM核心处理器的性能测试比较数据,Denver能否提升在移动设备应用领域的份额尚不明朗,在该领域落后Qualcomm。
第2页:Denver处理器核心架构
基于“Denver”项目Nvidia芯片产品细节并未透露过多,但从发展蓝图的一些愿景,英伟达下一重大市场动作是即将推出Logan,这款Tegra 5 SoC将针对智能手机和平板电脑的芯片中整合Kepler GPU,首个基于ARM SoC支持其CUDA软件环境,CUDA并行运算原本仅用于基于x86服务器和超级计算机中。
Tegra K1处理器
从现有资料了解,NVIDIA最新公开的Tegra K1双核处理器,采用两组Denver处理器心、64位ARMv8架构、最多能执行7个指令集,最高运作频率2.5GHz,128+64KB L1高速缓存令,除了能支持更多RAM的数目外,整体效能也大幅提高,而且两款处理器的针脚亦相互兼容。
同时,Tegra K1 Denver处理器同样内建 NVIDIA Kepler架构的192 CUDA核心GPU,其功耗表现却与上代产品相同,特别图像处理器性能上优化。此外,Cahce方面其整合128KB及64K的一级指令及数据缓存,并加入2MB二级缓存,相对32bit版本效能倍级提升。
与此同时,最新Denver架构中加设Dynamic Code Optimization技术,主要常用将应用程序软件优化并转译,提升指令的执行效率。据NVIDIA表示,该优化程序链结了相关的例行程序(routines),并应用了128MB的主存储器,在操作系统开机之前进行安全分割,优化程序可带来两倍以上的速度提升。
如果Denver真是一个代码融合/模拟CPU产品,那么64位版本的Tegra K1将是一个全新的芯片。事实上,ARM仍持续寻求混合搭配32位与64位核心的解决方案。作为英伟达尚未指定应用市场领域,尽管Denver的特点包括重复使用内存管线(pipeline)以统整流量,以及可补偿高速缓存遗漏的预先撷取(pre-fetch)功能,但无论是移动或服务器产品上,芯片仍然需进行大量的测试和优化。
Tegra K1预计将在2014年下半年上市。