多核处理器共享Cache低功耗可重构方法
方 娟,雷 鼎
【摘 要】摘 要:为了降低整个处理器的功耗,分析了当前多核Cache低功耗技术,并提出一种面向多核共享Cache低功耗的重构方法.在共享Cache上进行静态重构,分析了Cache重构的必要性,然后在Cache访问的过程中加入重构策略.实验结果证明:在性能平均损失4%的情况下,功耗平均降低了18%左右. 【期刊名称】北京工业大学学报 【年(卷),期】2013(039)009 【总页数】5
【关键词】关键词:多核处理器;重构;低功耗
随着半导体技术的进步,处理器的集成度越来越高.过去的单核处理器的性能已经发挥到极致,进而多核处理器成为现在主流的处理器.1996年,美国斯坦福大学首次提出片上多核处理器(CMP)思想和第1个多核结构的原型,目前多核处理器已经成为市场的主要产品.
Cache是一种高速缓冲存储器,可以缓和主存的速度和CPU处理速度不一致的问题.由于对微处理器性能的追求,导致Cache的容量越来越大,多核的出现更是加快了片上Cache容量增大的速度.Cache因容量大、速度快、访问频繁,成为片上处理器功耗的主要来源,其功耗约占处理器总功耗的30% ~60%[1-2].所以,设计低功耗的Cache可以有效地降低CPU的整体功耗,对于当今倡导的节能、环保具有重要意义.
近几年很多研究者对可重构Cache进行了研究.可重构分为以下几个方面:一是路可重构,也就是相联度可重构.相联度重构就是在程序运行的过程中允许
Cache相联度改变,让部分路关闭从而节省功耗.文献[3]用软件的方法使数据Cache相联度发生变化,这种方式可以让Cache操作时关闭Cache的部分路,在高需求时让Cache所有路工作,从而平衡Cache的性能和功耗.二是组可重构,组可重构就是允许Cache中的部分组处于关闭或休眠状态.传统的Cache结构中,索引位数决定了Cache的组数,因此,如果重构Cache的组数,相应的标记位和索引位位数都要发生变化.所以组可重构的实现比路可重构的实现要复杂.最后一种就是组和相联度混合重构的方法,混合重构让Cache重构有更多的选择.Peng等[4]提出 了一种自适应算法PBSTA(phase-based self-tuning algorithm),实 现Cache可重构.在二级Cache上,周宏伟等[5]提出保守多状态(C-SP&SD)和推断多状态(S-SP&SD)两种L2 Cache漏流功耗控制策略,它能将状态保留(state-preserving)与状态破坏(state-destroying)两种低功耗模式相结合从而降低功耗.
本文提出的Cache重构策略应用于多核处理器的共享二级Cache上,它是路可重构方法,通过在程序运行的过程中动态地获得程序运行相关参数继而改变二级Cache的相联度,从而在性能牺牲较小的情况下降低更多的功耗.
周宏伟等[6]在体系结构级上提出了2种功耗控制策略,分别是“使用双预测端口的多路路预测策略”和“基于分阶段访问Cache的按需唤醒预测策略”,能更有效地降低指令Cache和处理器的功耗.Powell等[7]提出一种降低片上Cache功耗的方法,它结合了路预测和直接映象2种方法.黄海林等[8]提出一种基于分离比较Cache设计方案,通过设计一个存储比较器,达到高性能和低能耗的效果.
针对功耗优化的大部分文献是针对嵌入式处理器中的指令Cache、数据Cache,
所使用的方法各异,有的是针对特定的应用,有的不能应用于多核处理器中,有的随着工艺的发展也将不能被应用,所有这些方法优化能耗效果也不同,但随着处理器的发展,通用处理器的能耗也受到更多的关注,特别是靠近主存大容量的缓存能耗问题.本文提出的体系结构级下多核共享Cache功耗优化的方法,是根据程序的应用需求提出的,能更好地服务处理器的负载,达到资源充分利用的目的.它的适用性高,能耗优化效果也更加明显.
1 多核处理器共享Cache重构方法
1.1 多核体系结构
在硬件设计完成时,微处理器结构中各种硬件配置已经固定,只有通过硬件或者软件的方法来动态改变Cache的一些参数配置.对处理器来说每次运行程序都不同,不同的程序导致对Cache的需求也不同,对于较大的程序,可能需要较大容量的Cache,因为如果Cache较小,Cache的缺失率就会增大,从而影响整个处理器的性能.对于较小的程序,如果Cache容量过大,Cache的命中率会很高,同时整个处理器的能耗也很大.通用的处理器中一级Cache和二级Cache大小都是固定的,无法根据程序的需求自动调整.特别在多核中,共享Cache容量更大,Cache使用效率更低.多核存储体系结构如图1所示. 1.2 Cache重构方式
当前Cache重构主要分为2种方式:静态重构和动态重构.静态重构是指在程序运行之前改变Cache的配置,观察Cache配置的变化对处理器性能造成的影响.动态重构是指在程序运行的过程中根据需要改变Cache的配置,关闭部分闲置Cache,减小这部分Cache所占的功耗,除了对性能造成较小的影响外,极大地降低了功耗.