绿色为先 Intel芯片节能技术全方位解析

如今,能源问题已经成为了世界关注的首要问题。经济的快速发展,绿色中心、绿色数据中心不断地扩充,让世界终于开始讲目光从数据中心无休止的扩张上,转移到数据中心的绿色环保上。目前来看,由于云计算的概念被广泛传播,一些企业已经开尝试采用云计算建设数据中心,从而提升企业的IT技术架构的运行效率。而企业对数据中心的改造,目的主要围绕着降低成本、扩大规模。

过去几年来,英特尔通过以相同功耗提供更出色的性能进一步降低了数据中心的功耗。在这一过程中,英特尔的硬件及软件产品已经帮助数据中心在节能减排方面取得了多项进展,更低的系统功耗、更快速的处理速度及更智能的功耗调节成为了英特尔津津乐道的内容。在数据中心应用当中,英特尔智能节能技术已经担当起越来越重要的角色。

自动化能效——集成功率门限(Integrated Power Gates)技术

集成功率门限(Integrated Power Gates)可将个别闲置内核的功耗降低至接近于零的状态,而不受其它运行内核的影响,相比以前的至强服务器处理器来说可使闲置功耗降低达 50%以上。

从至强5500系列开始,英特尔将集成功率门限作为处理器重要的技术应用到处理器当中。集成功率门限运行的原理是这样的——当处理器需求非常频繁的时候,处理器的每个核心都会紧张忙碌的工作;而当需求下降到一定程度时,某些内核可能并没有需要处理器的线程内容,在发现不活跃的处理器内核之后,系统可以智能将这些内核的功耗降低到接近于0的状态,进而降低处理器的功耗。

智能电源管理——英特尔智能节能技术(Intel Intelligent Power Technology)

自动低功耗状态(Automated Low Power States)可以自动将处理器和内存置入最低功耗状态,从而在不影响性能的情况下满足当前工作负载的运行需求。相比最初的英特尔四核处理器,英特尔至强5500系列处理器使电源管理能力提高了5倍:运行状态增加5倍,闲置功耗降低5倍,从低功耗状态来回切换的速度提高了5倍。

当服务器工作负载较轻的时候,依靠自动低功耗状态技术,通过监控I/O、内存、处理器的工作负载要求,可在负载需求降低的时候将这些组件自动降低到最低的可用功耗状态,这样可以在不影响整体性能的情况下显著的降低能耗,进而降低成本。

如果要用更易懂的语言来形容智能节能技术的话,那么它就相当于一个非常高级的汽车用自动变速箱,它的厉害之处,就是可以感应到驾驶者对车速的要求,自动在十多个档位之间自动、平滑的切换,从而保证汽车时时都能在满足这些速度要求的同时维持最佳燃油利用率。

总体说来,英特尔功率门限(Integrated Power Gates)和英特尔智能节能技术(Intel Intelligent Power Technology)——这对组合可是今天英特尔服务器处理器能够实现最优化节能效果的功臣。前者是基于英特尔领先的制造工艺和晶体管技术,可以将处理器闲置时的功耗大幅降低,并允许其每个内核单独降低功耗;后者则更为智能,可判断出处理器正在运行的工作负载压力和数据吞吐量,并根据其变化让处理器在多达15种运行状态(每种状态对应不同的功耗水平)间切换,从而实现自适应的、迅捷的功耗调节功能,这种功能能够让处理器在输出足以满足应用需求的性能的同时,实现最大程度的节能。

免费主频提升——Intel Turbo Boost Technology

众所周知,核心数量在一定程度上决定了处理器的功耗。处理器的核心数量越多,其功耗也会不可避免的会增加。然而,针对于多核心处理器高功耗的问题,除了刚刚我们介绍的功率门限和智能节能技术之外,Intel Turbo Boost Technology也为能效管理起到了重要的作用。

Turbo Boost,顾名思义,就是加速技术,它最初来源于Nehalem架构的至强5500处理器当中。借助电源管理技术,通过分析当前处理器的负载情况,智能地完全关闭一些用不上的核心,把能源留给使用中的核心,并使它们运行在更高的频率,进一步提升性能;相反,需要多个核心时,动态开启相应的核心,智能调整频率。这样,在不影响处理器的TDP情况下,能把核心工作频率调得更高。

举个简单的例子,如果某个游戏或软件只用到一个核心,Turbo Boost技术就会自动关闭其他三个核心,把运行游戏或软件的那个核心的频率提高,也就是自动超频,在不浪费能源的情况下获得更好的性能。

Nehalem架构的CPU每一个核心都有自己的PLL(Phase Locked Loop,相位锁定回路)电路,这样每个核心的电压和频率都可以独立控制,为此Intel专门在CPU内部设计了PCU(Power Control Unit,功耗控制)单元,PCU会以1ms(每秒1000次)的速度实时监测这四个核心的温度、电流及功耗等参数。独立控制的状态参数也是Turbo Boost加速的物理基础。

除独立的物理电路之外,Turbo Boost还需要Deep Power Down Technology技术(深度电源管理模式)的辅助,它将CPU内核按照不同的活动状态分类,历经多代技术之后目前有C0、C1、C3、C4和C6等几种状态,其中C1为工作模式表示当前正在执行指令,C1到C6则为不同的省电模式。其中值得注意是C6状态,此状态下处理器可实时清除L1 Cache内所有数据,在保存处理器微架构状态下,关掉内核(Core Clock与PLL将停止)及L2 Cache,虽然芯片组会继续为I/O提供内存交换动作,但却不会唤醒相关内核。只有需要内核时,电压才会攀升,开启Core Clock与PLL,处理器将进行重置,把Cache数据从内存中回传,微架构状态将完全恢复,继续执行指令。

而当英特尔推出Sandy Bridge处理器的时候,Intel Turbo Boost Technology技术也随之升级到了2.0版本,它在原有的基础上改进了算法,增强了自动提速的弹性,甚至可以动态调控集成的GPU的频率。

Turbo Boost 2.0可以短时间突破TDP功耗限制

在Turbo Boost 2.0中,TDP方面的限制有所放松,PCU单元可以控制active core在较短时间内突破TDP上限之后才会逐渐降至稳定状态,IDF会议上的资料显示最高峰阶段长达25秒,不要小看这一点时间,这只是一个加速周期循环,等到CPU的发热被带走之后,TurboBoost 2.0也会进入下一个25秒的加速循环,这样累积下来的提速效果将比目前1-2 bins的提升更为明显。最重要的是,用户也不必担心这样做会损坏处理器,因为短时间超越TDP功耗依然处于安全设计内。

另外值得一提的是Turbo Boost 2.0中不仅能调节CPU频率,也会对集成GPU同样也会起到加速作用,并随着系统负载的不同协调二者的频率升降。

云计算时代的数据中心, 一方面要求数据中心保持高可用性,能高效、安全地运营;另一方面,用户会尽可能要求数据中心降低能源消耗和运行成本;而且数据中心必须具备灵活的扩展能力,以应对多变的业务需求及未来的不确定因素。借助于英特尔处理器的集成功率门限及智能电源管理技术,可以帮助企业更好的实现节能与高效,从而在竞争中获得充分的灵活性与强大的实力。