x86星火燎原:新至强的变迁(二)

在上篇x86星火燎原:新至强的变迁(一)http://www.doserv.com/article/2012/0409/2480972.shtml)里,我们介绍了英特尔确定独立的“Xeon”(至强)品牌以及由此带来的至强芯片的发展,本节我们将继续带你了解至强处理器的新旅程。

Paxville MP至强处理器

在Paxville DP至强发布一个月后,2005年11月1日,英特尔提前发布了原定于2006年1月发布的Paxville MP处理器。Paxville MP面向多路服务器平台,被命名为Xeon 7000系列。

Paxville MP和Paxville DP一样均采用90纳米工艺,也是采用了将两个核心封装到一个CPU中的方式,每个核心独享2MB或1MB二级缓存。Paxville MP双核至强处理器有4个型号,分别为Xeon 7020/7030/7040/7041,主频从2.67GHz至3.0GHz,Xeon 7020和7030采用了2MB二级缓存,Xeon 7040和7041采用了4MB二级缓存。前端总线依旧采用双核心共享的方式,分别为667MHz或800MHz。

Paxville MP将双核性能引入到四路及四路以上平台,在其他特性上,Paxville MP也具备超线程技术、EM64T内存技术等,值得一提的是,Paxville MP是第一款引入Intel VT硬件虚拟化的技术的处理器。

Xeon LV低电压至强

2006年3月,英特尔在高端处理器上的思路有了转移,推出了一款基于移动双核处理器改造而来的双路至强“Sossaman”,这种双核芯片的名称为Xeon LV,它的功率只为其他Xeon芯片的1/5至1/3,最大功率为31瓦。

Xeon LV处理器是英特尔Core微构架在Xeon系列处理器上的初次尝试,包含主频2.0GHz和1.66GHz的两个型号,前端总线为667MHz,共享2MB二级缓存,这也是英特尔首款共享二级缓存的双核处理器。由于Sossaman是由移动处理器改造而来,所以不具备超线程和EM64T技术,但是支持SpeedStep功耗调节技术,可根据负载而调节工作电压,节省电能。低电压并没有让Sossaman的性能表现不佳,据测试,2.0GHz主频的Sossaman至强性能可以和3.0Ghz的Xeon DP处理器相当。可以说Sossaman是英特尔至强处理器历史上一款成功的产品。

Dempsey核心Xeon 5000系列

随着英特尔芯片制程工艺进步到65纳米,2006年5月23日,英特尔发布了采用65纳米工艺的“Dempsey”双核至强处理器,面向双路服务器和工作站市场。虽然2006年更为先进的Core微构架已经出现,但Dempsey仍然采用了Netburst构架,是英特尔最后一代采用Netburst微构架的至强处理器。

Dempsey采用了新的命名方式,称之为Xeon 5000系列,是第一个采用65纳米工艺的双核至强处理器系列。Dempsey不再采用Socket604封装,而采用LGA771封装。Dempsey共有5个型号,编号从Xeon 5030到5080,频率从2.67至3.73,前端总线有667MHz和1066MHz两种,每个核心集成2MB二级缓存。

虽然从规格上来看Dempsey和上一代的Paxville DP双核至强相比,频率并不突出,二级缓存也相同,但是Dempsey采用了双独立总线设计,前端总线提升到了1066Mhz,总带宽达最高达到了17Gbps,远远超出了上代的6.4Gbps,获得更高的数据传输速度。不过从功耗上来看,虽然工艺进步到了65纳米,但是由于Netburst架构的局限性,Dempsey至强功耗最高还是达到了130w。

Woodcrest核心至强5100系列

2006年以后,英特尔处理器全面向新一代Core微构架过渡,Core微构架多项先进的技术特性解决了处理器高功耗高热量的问题,也使处理器的执行效率大大提高。2006年6月26日,英特尔发布了全新一代采用Core微构架的双核至强DP处理器,代号“Woodcrest”,以Xeon 5100系列命名。

Xeon 5100系列包含7款处理器,从Xeon 5110到Xeon 5160,主频从1.6Ghz至3.0GHz,前端总线再次提升,包括1066Mhz和1333Mhz两种。和Dempsey不同,Woodcrest具备的4MB二级缓存是由两个核心共享,提高了二级缓存的利用率,大大降低了缓存数据延迟的问题。

Woodcrest仍然采用了双独立总线设计,前端总线提升到了1333Mhz,总带宽达到了21Gbps,相对Dempsey有了进一步的提升。第一代的Core微构架没有引入超线程技术,所以Woodcrest可以处理2个并发线程。除此之外,Xeon 5100系列支持EM64T、XD bit、FB-DIMM以及Intel VT虚拟化技术。

Core微构架具备宽位动态执行、智能功率特性、先进缓存管理、智能内存访问还有高级数字媒体增强这五大技术,大大降低了功耗,Woodcrest平均功耗只有65w,最高80w,相对上一代的Dempsey几乎降低了一半,获得了前所未有的能效提升。

Tulsa核心双核Xeon 7100系列

2006年8月29日,英特尔发布了面向多路服务器市场的Xeon 7100双核处理器,Xeon 7100系列采用65纳米工艺,这意味着在2006英特尔的至强处理器全面过渡到了65纳米时代。

Xeon 7100系列处理器代号为“Tulsa”,没有采用Core微构架,而是采用了上一代的Netburst构架。虽然架构不是最新的,但是Tulsa在性能和功耗上都有不少的改进。Tulsa至强具有8个型号,主频从2.6Ghz到3.4Ghz,3GHz以上的功耗为150w,以下的为95w。Tulsa至强为每个核心设置了1MB的二级缓存,虽然二级缓存比上一袋的Xeon 7000系列减少了一半,但是Tulsa至强上增加了大容量的三级缓存,有4MB、8MB和16MB三种,完全弥补了二级缓存的不足。

Tulsa具有667和800MHz两种前端总线,支持超线程、EM64T、Intel VT虚拟化等技术特性,虽然特性上相对于Xeon 7000系列没有太多的创新,凭借制程工艺的进步和大容量的三级缓存,Tulsa至强相对之前的Xeon MP性能可以提升70%,性能/功耗比提升3倍。

Intel Xeon 3000双核系列

2006年9月,英特尔发布了面向中低端服务器市场的单路双核Xeon 3000系列处理器,取代之前的单路单核Pentium D处理器。Xeon 3000系列处理器代号为“Conroe”,与酷睿桌面处理器相同,采用了65纳米工艺和Core微构架,在能效上得到了长足的进步。

Xeon 3000系列处理器包括7个型号,从Xeon 3040到3085,主频从1.86Ghz到3.0Ghz,前端总线为1066MHz和1333Mhz,共享2MB或4MB二级缓存,接口采用了和桌面处理器相同的Socket 775,支持Intel VT技术、EM64T技术等。

Clovertown四核Xeon 5300系列

2006年11月14日,英特尔在北京发布了面向服务器、工作站和高端个人电脑的英特尔至强5300系列处理器。从这一刻开始,处理器的四核新时代正式到来。代号“Clovertown”的四核至强是将两颗双核“Woodcrest”封装在一起,采用酷睿微构架,65纳米工艺,前端总线支持1333Mhz,二级缓存提高到8MB,但是功耗依旧为80W和65W,每瓦特性能相对Woodcrest有了巨大的进步,并且同属于“Bensely”平台,从双核Woodcrest可以实现无缝的升级,这也是四核至强的一个重要卖点。

除了核心数量、二级缓存、前端总线、功耗上的进步外,Clovertown四核至强处理器支持对称式多重处理器(Symmetric Multi-Processor,SMP)技术、Intel虚拟化技术(Virtualization Technology)、Intel病毒防护技术(Execute Disable Bit),Intel 64位扩展技术(Intel EM64T)及Streaming SIMD Extensions 4 (SSE4)指令集,提供了业界领先的性能和虚拟化能力,并获得了领先Woodcrest双核至强1.5倍的能效。凭借Clovertown优秀表现,英特尔2006年迅速确立了在多核市场的领导地位,也将服务器市场引领到了四核时代。

Tigerton四核Xeon 7300系列

2007年9月6日下午,英特尔公司全球同步发布了四核英特尔至强处理器7300系列服务器处理器平台。该系列处理器用于配置四路及四路以上服务器,随着它的发布,英特尔公司为用户提供全线了基于英特尔酷睿平台的至强处理器产品。

代号为Tigerton的Xeon 7300系列处理器采用了Core微架构以及65纳米制造工艺,相比于现有的Xeon 7000/7100系列处理器,Tigerton四核处理器的功耗有了进一步的降低,用于刀片式服务器的处理器TDP为50瓦,用于机架式服务器的处理器TDP为80瓦,性能优化型处理器的TDP为130瓦。

Xeon 7300系列家族共有6位成员,它们分别是主频高达2.93GHz的X7350处理器,其功耗也达到了130瓦,四款功耗在80瓦的E7310、E7320、E7330、E7340处理器,和一款针对四插槽刀片式服务器和高密度机架式服务器优化的50瓦版L7345处理器,主频为1.86GHz。E7310和E7320的二级缓存为4MB,E7330为6MB,E7340和其他两款处理器的二级缓存均为8MB。

通过将英特尔酷睿架构、四核与英特尔虚拟化技术应用到高端服务器上,至强7300系列处理器为客户在虚拟化应用和服务器整合上提供了一个理想的平台。

Hapertown四核Xeon 5400系列

2007年11月16日,英特尔公司发布了采用高K金属栅技术的全新45纳米至强5400系列处理器,新的材料使处理器上的晶体管制程工艺冲破极限,解决了漏电和功耗问题,这也意味着英特尔的摩尔定律也许会再延长十年。

45纳米四核至强是英特尔历史上里程碑式的产品,一片晶圆上的晶体管数量从5.8亿个上升到8.2亿个,先进的制程工艺让晶体管密度提升近一倍,可以进一步的提升频率,或者降低芯片面积。高K金属栅技术也让晶体管开关动作所需电力更低,耗电量减少近30%。相较上代65纳米制程产品,在同一功耗表现下,45纳米工艺让处理器频率可提升约20%,或者也可以说在同一频率下功耗更低。

Xeon 5400代号“Hapertown”,系列包含17款处理器,从2.0GHz的Xeon 5405到主频3.2Ghz的Xeon 5482,其中包括3款低电压版本。从上面的表格可以看到,Xeon 5400系列至强二级缓存相对上一代的四核Xeon 5300系列有了进一步的提升,从8MB增加到12M。Hapertown依旧采用了双独立总线设计,前端总线为1333Mhz或者1600MHz,总线带宽高达25Gbps左右。从功耗上来看,高端的Hapertown功耗达到120w或150w,其余为80w,并不高于65纳米处理器,但是提供了前所未有的每瓦特性能。45纳米至强5400处理器也是英特尔首次采用无铅材料的产品,更加绿色环保,也会对芯片产业的发展起到非常大的推动作用。

Dunnington六核Xeon 7400系列

四核心并不是终点,在四核处理器取得巨大成功的同时,英特尔并没有停止脚步。2008年9月22日,英特尔在全球同步发布了采用45纳米工艺的六核至强7400服务器平台,应用于四路及以上的高端服务器,面向虚拟化、数据库、企业资源规划和电子商务等关键应用。

Xeon 7400系列代号“Dunnington”,并不完全是六核产品,包括三款六核心和四款四核心产品。六个核心的Dunnington至强六个核心与三级缓存完全建立在一个晶片之上,也就是说,Dunnington采用“原生”设计,减少了性能的牺牲。在缓存上,Dunnington每两个核心共享3MB二级缓存,二级缓存总数为6MB。为了进一步推进处理器的性能,Dunnington还提供了最高16MB的三级缓存,前端总线为1066MHz,TDP最高为130W。

基于至强7400系列处理器的服务器平台可支持最多16个处理器插槽,以提供高达96个处理器核心的计算能力。它为企业数据中心提供了出色的可扩展性、充足的计算线程、丰富的内存资源和无与伦比的可靠性。

Nehalem-EP四核Xeon 5500系列

2009年3月31日,英特尔公司发布了至强5500系列处理器。至强5500系列理器是自15年前英特尔面向服务器市场推出英特尔奔腾 Pro 处理器以来最具突破性意义的服务器处理器。当天发布至强5500系列处理器共有12款,规格从低到高依次是E5502、E5504、L5506、E5506、L5520、L5530、E5520、E5530、E5540、X5550、X5560、X5570、W5580,均采用45纳米工艺制程。

代码为Nehalem-EP的至强5500系列处理器采用了多项能大幅提高系统速度和自适应性的突破性技术。这些技术的采用可帮助系统更好的适应不同的工作负载,其中包括英特尔智能加速技术(Intel Turbo Boost Technology)、英特尔超线程技术(Intel Hyper-Threading Technology)、集成功率门限(Integrated Power Gates)、因采用了扩展页表(Extended Page Tables)而得到增强的英特尔虚拟化技术(Intel Virtualization Technology)。

Nehalem架构一个重大的创新设计是废弃了传统的前端总线,而采用全新的QuickPath互联。此前,在英特尔处理器平台中,处理器和内存之间的数据传输需要通过前端总线,而处理器和处理器之前的数据传输同样要通过前端总线。虽然在5000系列处理器平台中FSB已经支持到1333MHz,不过随着处理器内核的不断增多,对于数据I/O的需求也越来越大,传统的前端总线的带宽限制和延时也越来越成为制约因素。

而QuickPath是一种平台架构,能提供处理器与处理器之间、处理器和内存之间、以及处理器与I/O中枢之间的高速连接,这种点对点的连接消除了传统FSB中的延迟,更加高效而快速。QuickPath架构一个最大的变化就是可扩充共享内存的部署,如果一个处理器需要访问另外一个处理器上的专用内存,可通过连接至所有处理器的高速QuickPath互联来访问。Nehalem架构中QPI总线最高可以达到6.4GT/s,在至强5500处理器中,根据型号的不同,还有4.8GT/s和5.86GT/s两种。

与前代英特尔至强5400系列处理器相比,至强5500系列处理器的性能提升了2倍以上,并刷新了30余项世界纪录,确立了双路处理器性能的新标准。至强5500系列处理器还具有自适应的能效增强特性,支持用户更好地控制能耗成本。其中一款处理器的闲置功耗仅为 10 瓦,比前代产品降低了50%。新增的集成功率门限特性基于英特尔独有的高-k 金属栅极技术,允许空载内核单独降低功耗。

Westmere-EP六核Xeon 5600 系列

2010年3月17日,英特尔正式发布了采用32nm工艺的新一代Nehalem微构架双路服务器处理器至强5600系列,代号“Westmere-EP”。

至强5600工艺进步到32nm,并采用了第二代High-K金属栅晶体管技术。与上一代的45nm技术相比,32nm技术将高K电介质的氧化层从 1.0nm缩短到0.9nm,栅极长度所见到30nm左右,这让晶体管的性能提高了22%以上。此外,在32nm技术中漏电电流也得到了优化,与45纳米制程相比,NMOS晶体管的漏电量减少5倍多,PMOS晶体管的漏电量则减少10倍以上,由于上述改进,32nm技术让处理器电路的尺寸和性能均可得到显著优化。制程工艺的进步让至强5600芯片面积缩小为240平方毫米,但却可以集成11.7亿个晶体管(至强5500为263平方毫米,7.31亿个晶体管),可以集成最多6个计算核心,并集成了12MB L3缓存。

虽然比至强5500多出两个内核,但是由于制程的进步,至强5600系列的功耗并没有提高。如同级别的X5670和X5570,前者多出两个核心,功耗都是95W。其中,至强X5680、X5670、X5660、X5650和L5640均为六核心12线程,主频从3.33GHz到2.26GHz不等,三级缓存12MB,热设计功耗最高端型号X5680为130W,低压版型号L5640为60W,其他均为95W,全部支持Turbo Boost睿频加速技术。

Nehalem-EX八核Xeon 7500系列

2010年3月31日,英特尔至强7500系列处理器发布,这不仅标志着英特尔已完成了整个处理器产品线的架构替换,更是助推X86处理器达到了一个新的高峰。

与之前的产品相比,新发布的多路处理器产品从性能到可靠性的飞跃使得其足以应对更多的挑战。至强处理器7500系列可用于构建从双路到最高256路的服务器系统,与已被广泛采用的上一代产品至强处理器7400系列相比,其性能平均提升达3倍之多,在企业级性能基准测试中创下了更为领先的成绩,而在可靠性方面,20多种可用于增强系统可靠性的全新技术特性更是让其得以在关键应用市场一展身手。 

至强7500系列最多可集成8个内核,新加入的超线程性能使得其可以并行执行16个线程。在总线架构上,Nehalem架构中独特的QPI直连不仅使得多路处理器间的通讯效率明显提升,增进了多路系统耦合度,更可以帮助系统轻松扩展至拥有32个内核和64个线程的四路平台,或是拥有64个内核和128个线程的八路平台,而如果采用第三方节点控制器,系统更是能够最多扩展至256路。

至强7500系列时钟频率最高可达2.66GHz,并集成24 MB英特尔智能高速缓存,可满足高度并行化的、对数据处理性能要求苛刻的和关键任务型工作负载的需求。而自动调整运行频率的睿频技术也使至强7500能够灵活应对线程敏感或主频敏感的不同应用,并能够根据任务负载调节核心活跃程度,减少不必要的能源浪费。

至强7500系列处理器均集成有两个双通道内存控制器,每个通道可以连接四条内存,凭借相当于至强处理器7400系列8倍的内存带宽,以及与每个处理器搭配的16根内存插槽带来的、相当于前一代产品4倍的内存容量提升,至强处理器7500系列在四路服务器平台中能够支持高达1TB(即1000 GB)的内存容量。