解析英特尔新处理器酷睿微体系结构的创新特性

    英特尔酷睿微体系结构,是一款领先节能的新型微架构,设计的出发点是提供卓然出众的性能和能效,提高每瓦特性能,也就是所谓的能效比。英特尔酷睿微体系结构面向服务器、台式机和笔记本电脑等多种处理器进行了多核优化,其创新特性可带来更出色的性能、更强大的多任务处理性能和更高的能效水平,各种平台均可从中获得巨大优势: 
  
    服务器可以更快速,更低的功耗为企业节省大笔开支,创新技术保证安全稳定的运行。 
  
    台式机可以在占用更小空间的同时,为家庭用户带来更多全新的娱乐体验,为企业员工带来更高的工作效率。 
  
    笔记本电脑用户可以获得更高的移动性能和更耐久的电池使用时间。 
  
    下面让我们来详细了解英特尔酷睿微体系结构的几大主要创新,能够为您带来哪些好处。 
  
    英特尔宽位动态执行(Intelreg; Wide Dynamic Execution) 
  
    当今衡量一款处理器的性能水平,已经不能再单纯的以频率的高低考量,而是更强调“每瓦特性能”,也就是所谓的能效比。“性能=频率×每个时钟周期的指令数”是英特尔提出的对性能的创新理解,英特尔宽位动态执行通过提升每个时钟周期完成的指令数,从而显著改进执行能力。 
  
    英特尔酷睿微架构拥有4组解码器,相比上代Pentium Pro (P6) / Pentium II / Pentium III / Pentium M架构拥有3组可多处理一组指令,简单讲,每个内核将变得更加“宽阔”,这样每个内核就可以同时处理更多的指令。 
  
    英特尔酷睿微体系结构在提升每个时钟周期的指令数方面做了很多努力,例如新加入宏融合(Macro-Fusion)技术,它可以让处理器在解码的同时,将同类的指令融合为单一的指令,这样可以减少处理的指令总数,让处理器在更短的时间内处理更多的指令。为此英特尔酷睿微体系结构也改良了ALU(算术逻辑单元)以支持宏融合技术。 
  
    英特尔智能功率能力(Intel Intelligent Power Capability) 
  
    英特尔智能功率能力,可以进一步降低功耗,优化电源使用,从而为服务器、台式机和笔记本电脑提供个更高的每瓦特性能。新一代处理器在制程技术方面做出优化,采用了先进的65nm应变硅技术、加入低K栅介质及增加金属层,相比上代90nm制程减少漏电达1000倍。 
  
    值得注意的是,英特尔加入了超精细的逻辑控制机能独立开关各运算单元,具体来讲,酷睿微体系结构采用先进的功率门控技术。以往功率门控技术实现起来十分困难,因为元件开关过程需要消耗一定的能源,而且由休眠到恢复工作也会出现延迟,但英特尔酷睿微体系结构已经解决这些问题。 
  
    通过该特性,可以智能地打开当前需要运行的子系统,而其他部分则处于休眠状态,这样将大幅降低处理器的功耗及发热。 
  
    英特尔高级智能高速缓存(Intel Advanced Smart Cache) 
  
    以往的多核心处理器,其每个核心的二级缓存是各自独立的,这就造成了二级缓存不能够被充分利用,并且两个核心之间的数据交换路线也更为冗长,必须要通过共享的前端串行总线和北桥来进行数据交换,影响了处理器工作效率。


    英特尔酷睿微结构体系结构采用了共享二级缓存的做法,有效加强了多核心架构的效率。这样的好处是,两个核心可以共享二级缓存,大幅提高了二级高速缓存的命中率,从而可以较少通过前端串行总线和北桥进行外围交换。 
  
    英特尔高级智能高速缓存还有其他方面的优势,每个核心都可以动态支配全部二级高速缓存。当某一个内核当前对缓存的利用较低时,另一个内核就可以动态增加占用二级缓存的比例。甚至当其中的一个内核关闭时,仍可以保持全部缓存在工作状态,另外也可以根据需求关闭部分缓存来降低功耗。 
  
    这样可以降低二级缓存的命中失误,减少数据延迟,改进处理器效率,增加绝对性能和每瓦特性能。 
  
    英特尔智能内存访问(Intel Smart Memory Access) 
  
    英特尔智能内存访问是另一个能够提高系统性能的特性,通过缩短内存延迟来优化内存数据访问。英特尔智能内存访问能够预测系统的需要,从而提前载入或预取数据,反映到用户的直接使用体验上,就是大幅提高了执行程序的效率。 
  
    以前我们要从内存中读取数据,就需要等待处理器完成前面的所以指令后才可以进行,这样的效率显然是低下的。而英特尔酷睿微体系结构中加入一项名为内存消歧的能力,它可以对内存读取顺序做出分析,智能地预测和装载下一条指令所需要的数据,这样能够减少处理器的等待时间,减少闲置,同时降低内存读取的延迟,而且它可以侦测出冲突并重新读取正确的资料及重新执行指令,保证运算结果不会出错误,大大提高了执行效率。 
  
    英特尔高级数字媒体增强(Intel Advanced Digital Media Boost) 
  
    上面提到了“性能=频率×每个时钟周期的指令数”这个新概念,而英特尔reg;高级数字媒体增强也同样是为了提高每个时钟周期的指令数而诞生,它可以提高SIMD流指令扩展指令(SSE/SSE2/SSE3)的执行效率。之前的处理器需要两个时钟周期来处理一条完整指令,而Intel酷睿微体系结构则拥有128位的SIMD执行能力,一个时钟周期就可以完成一条指令,效率提升明显。 
  
    当前SSE指令集已经十分普遍地用于主流的软件中,包括绘图、影像、音频、加密、数学运算等用途,单周期128位SIMD处理器能力令处理器拥有高能效表现。 
  
    基于以上这些先进的创新特性,英特尔酷睿微体系结构提供了比前代架构更卓越的性能和更高的能效,为服务器、台式机和移动平台带来了振奋人心的全新高能效表现。