迅速成长的物联网、智能硬件、可穿戴式设备以及工业和汽车电子领域对微控制器(MCU)性能和功耗的要求日趋苛刻,如同智能手机处理器的性能大战一样,嵌入式处理器产品也正在经历属于自己的性能提升大战。意法半导体(ST)近日就宣布推出业界首款基于ARM最新Cortex-M7内核的STM32 F7系列微控制器,其性能远超ST之前的32位STM32F4微控制器,用户通过无缝升级路径可将处理性能和DSP性能提高一倍。
为高性能而生的Cortex-M7
一直以来,ARM Cortex-M架构处理器都是嵌入式领域的核心产品。数据显示,截止目前,该系列的芯片出货量已经达到了80亿颗、涉及器件种类3000种以上。 2013年,基于Cortex-M架构的嵌入式处理器的出货总量达到了29亿,2014年上半年的总出货量更是达到了17亿,超过175家来自全球的合作伙伴获得了Cortex-M授权。
作为Cortex-M系列最高性能的CPU内核,Cortex-M7目标定位于诸如智能控制系统的高端嵌入式应用,包括马达控制、工业自动化、先进语音功能、图像处理、各类联网交通工具应用以及物联网相关应用。除ST外,首批获得Cortex-M7处理器授权的厂商还包括Atmel与飞思卡尔(Freescale)。
之所以推出Cortex-M7内核,ARM嵌入式市场营销副总裁Richard York解释说,智能硬件的发展势不可挡,很多连网的智能嵌入式设备要求处理器提供更多的本地化处理功能,这对CPU的性能提出了更高要求。与此同时,更多显示、人机交互的语言识别需求也要求更高的CPU处理性能,这成为ARM设计M7内核的源动力所在。
“十年前,当ARM推出第一个Cortex-M系列内核时,我们承诺将把Cortex-M系列32位MCU做到一美元,甚至更低价位的市场,当时几乎所有人都觉得这是一个玩笑。但现在实际的市场需求告诉我们,这不是一个玩笑,而是一个事实。”York认为这得益于ARM与包括ST在内的合作伙伴始终保持着密切的合作关系,并且共同搭建了良好的嵌入式生态系统,从而能够为各类型的嵌入式应用设计出功能强大、更智能且更为可靠的微控制器。
ARM给出的数据显示,相较于目前性能最高的ARM架构微控制器,Cortex-M7可提升两倍的运算及数字信号处理性能,其性能测试结果最高达5CoreMark/MHz,能够更快速地处理音频、影像数据及语音识别。而以下三点,则被Richard York视作确保M7内核实现高性能的关键所在:首先,M7内核采用分支预测的6级超标量流水线,可同时支持单精度和双精度浮点单元;其次,支持64位 AXI AMBA4互联,可为高效内存操作提供I-cache与D-cache;最后,则是兼顾实时性、快速的相应能力,支持12个周期的中断延迟。
对DSP性能方面进行大幅优化,使之比热门的DSP产品更具竞争力,是此番ARM赋予Cortex-M7内核的重要卖点之一。 York说:“在最初规划Cortex-M7时,ARM就希望能在某些应用领域采用高端MCU取代DSP。为此,我们不但提供DSP的硬件部分,还包括配套的DSP软件服务。同时,ARM Keil工具链可帮助实现支持Cortex-M7的编制和调试,ARM软件界面也支持底层标准算法和接口,包括DSP优化算法。”
智能系统架构提升STM32 F7处理性能
ST微控制器市场总监Daniel Colonna将STM32 F7称之为“ST有史以来最聪明、最智能的微控制器”,不仅因为它有Cortex-M7内核,关键之处在于同时为该内核配置了更多智能化的外设和总线。 “对一颗MCU芯片来说,内核相当重要,但这不是全部。要想把内核性能发挥到极致,需要从系统架构层面做创新的设计。”
具体而言,STM32 F7采用两个独立机制取得零等待执行性能,包括内部闪存采用ST ART Accelerator访存加速技术,为外部存储器(或内部存储器)提供一级高速缓存;矩阵方面则使用了64位AXI和先进高性能总线矩阵(Multi- AHB, Advanced High-performance Bus),加上特别设计的双通用直接访存(DMA)控制器,可以使数据存储和指令输送实现零等待;此外,ST在存储方面做了更多的改进和提升,专门设计了灵活的大容量分布式架构SRAM以满足不同的应用需求。
尽管STM32 F7的DSP性能是STM32 F4系列的2倍多,但其能耗并未牺牲。新系列运行模式和低功耗模式(停止、待机和VBAT)的功耗与STM32 F4保在同一水平线上:工作模式能效为7 CoreMarks/mW;在低功耗模式下,当上下文和SRAM内容全都保存时,典型功耗最低120μA,典型待机功耗为1.7μA,VBAT模式典型功耗为0.1μA。