arm内核系列比较
ARM2009-06-1421:38:37阅读345评论0字号:大中小
器件的选择归根结底是为嵌入式系统选择合适的处理器芯片。ARM处理器是最常见的嵌入式处理器之一,它以低功耗、低成本和高性能而深受业界的青睐。而且ARM是目前产业中资源最为广泛的嵌入式处理器,基于广大的ARM合作伙伴计划,开发者可以在这个联盟里寻求到各种自己意想不到的帮助。从图2给出了常见的ARM处理器的架构和支持的操作系统。目前在业内广为人知的ARM处理器主要有ARM7系列和ARM9系列,同时为了关注今后嵌入式系统的发展,也有必要了解一下最新的ARM11和ARM Cotex系列处理器。
图2ARM体系结构 ARM7系列
ARM7TDMI是ARM7系列中使用最广泛的,它是从最早实现32位地址空间编程模式的ARM6内核发展而来的,并增加了64位乘法指令,支持片上调试、16位Thumb指令集和EmbeddedICE观察点硬件。ARM7TDMI属于ARM v4体系结构,采用冯诺伊曼结构,3级流水处理,平均0.9DMIPs/Mhz性能。不过ARM7TDMI没有MMU(Memory Management Unit和Cache,所以仅支持那些不需要MMU和Cahce的小型实时操作系统,如VxWorks、uC/OS-II和uLinux等RTOS。其他的ARM7系列内核还有ARM720T和ARM7E-S等。
ARM9系列
ARM9TDMI相比ARM7TDMI,将流水级数提高到5级从而增加了处理器的时钟频率,并使用指令和数据存储器分开的哈佛结构以改善CPI和提高处理器性能,平均可达1.1DMIPs/Mhz,但是ARM9TDMI仍属于ARM v4T体系结构。在
ARM9TDMI基础上又有ARM920T、ARM940T和ARM922T,其中ARM940T增加了MPU(Memory Protect Unit和Cache;ARM920T和ARM922T加入了MMU、
Cache和ETM9(方便进行CPU实时trace,从而更好的支持象Linux和WinCE这样的多线程、多任务操作系统。
ARM9E系列
ARM9E系列属于ARM v5TE,在ARM9TDMI的基础上增加了DSP扩展指令,是可综合内核,主要有ARM968E-S、ARM966E-S、ARM946E-S和ARM926EJ-S(v5TEJ 指令体系,增加了Java指令扩展,其中ARM926EJ-S是最具代表性的。通过DSP和Java 的指令扩展,可获得70%的DSP处理能力和8x的Java处理性能提升。另外分开的指令和数据Cache结构进一步提升了软件性能;指令和数据TCM(Tightly Couple Memory:紧耦合存储器接口支持零等待访问存储器;双AMBA AHB总线接口等。ARM926EJ-S可达250Mhz以上的处理速度,很好地支持Symbian OS、Linux
、Windows CE和Palm OS等主流操作系统。 ARM11系列
ARM11系列主要有ARM1136、ARM1156、ARM1176和ARM11MP-Core等,它们都是v6体系结构,相比v5系列增加了SIMD多媒体指令,获得1.75x多媒体处理能力的提升。另外,除了ARM1136外,其他的处理器都支持AMBA3.0-AXI总线。ARM11系列内核最高的处理速度可达500Mhz以上(其中90nm工艺下,ARM1176可达到750Mhz以及600DMIPS的性能,请参考和图3相关描述。
图3ARM11系列内核
基于ARMv6架构的ARM11系列处理器是根据下一代的消费类电子、无线设备、网络应用和汽车电子产品等需求而制定的。其的媒体处理能力和低功耗特点使它特别适合于无线和消费类电子产品;其高数据吞吐量和高性能的结合非常适合网
络处理应用;另外,在实时性能和浮点处理等方面ARM11可以满足汽车电子应用的需求。
ARM Cotex系列
Cortex系列是ARM公司目前最新内核系列,属于v7架构,主要有Cortex-A8、Cortex-R4、Cortex-M3和
Cortex-M1等处理器,其中A8是面向高性能的应用处理器,最高可达1Ghz的处理速度,更好的支持多媒体及其他高性能要求,最高可达2000DMIPS;R4主要面向嵌入式实时应用领域(Real-Time,7级流水结构,相对于上代ARM1156内核,R4在性能、功耗和面积(PPA: Performance,Power and Area取得更好的平衡,>1.5DMIPS/Mhz和高于400Mhz的处理速度。而M3主要是面向低成本和高性能的MCU应用领域,相比ARM7TDMI,M3面积更小,功耗更低,性能更高。Cortex-M3处理器的核心是基于哈佛架构的3级流水线内核,该内核集成了分支预测,单周期乘法,硬件除法等众多功能强大的特性,使其在Dhrystone benchmark上具有出色的表现
(1.25DMIPS/MHz。根据Dhrystone benchmark的测评结果,采用新的Thumb.-2指令集架构的Cortex-M3处理器,与执行Thumb指令的
ARM7TDMI-S.处理器相比,每兆赫的效率提高了70%,与执行ARM指令的ARM7TDMI-S 处理器相比,效率提高了35%。
目前已经有Cortex系列内嵌的产品问世,如TI公司推出的基于Cortex-A8内核的OMAP3430,TI、ST和Luminary也推出了基于Cortex-M3内核的低成本高性能32位MCU,更多详情请登陆这些公司的主页查询。