技术点评:服务器之争回归效能至上

    6月27日,英特尔Woodcrest处理器的上市拉开了其服务器处理器架构从NetBurst向酷睿转移的大幕,而其新的Bensley服务器平台的诸多先进特性也将得以充分发挥。


处理器: 向酷睿挺进


    目前英特尔服务器Xeon处理器有两个系列,面向双路(DP)市场的5000系列和面向多路(MP)市场的7000系列处理器。而DP处理器产品又包括两个大的系列??50××系列和51××系列。前者是基于NetBurst架构的Xeon处理器,其65nm产品研发代号为Dempsey,后者则是基于英特尔最新酷睿(Core 2 Duo)架构的产品,研发代号为Woodcrest。


    去年第四季度,英特尔发布了基于NetBurst架构的90nm Paxville双核 Xeon处理器,包括有双路和多路的产品,这也是英特尔第一款双核服务器处理器产品。作为Paxville DP的后续产品,今年5月深圳IDF期间,英特尔发布了65nm的Xeon DP处理器Dempsey。


    在低功耗市场,今年3月份美国IDF期间,英特尔推出了面向刀片和高密度市场的低电压双核Xeon处理器Sossaman。这是一款基于第一代酷睿(Core,即Yonah核心)的产品,其功耗仅为31W。


    DP平台在Woodcrest处理器上市后,将逐渐向酷睿架构过渡。基于酷睿微架构的四核Xeon DP处理器Clovertown也将于2007年第一季度上市。


    在多路市场上,目前还是NetBurst架构的天下。到今年第三季度,英特尔还将发布一款基于NetBurst架构的多路Tulsa处理器,基于65nm工艺制造。估计这也是最后一款基于NetBurst架构的Xeon处理器了。之后MP产品也将全面转向酷睿微架构。与DP市场不同,酷睿架构的MP处理器很可能直接进入四核产品,这就是计划于Clovertown之后上市的四核Xeon MP处理器Tigerton。


Woodcrest: 功耗继续下降


    最新发布的Woodcrest处理器内置了共享的4MB L2缓存,同时支持EM64T和SpeedStep节能技术。Woodcrest也成为第一款支持64位的酷睿架构处理器。


    在芯片发布时英特尔官方公布的数据中,Woodcrest与上一代处理器相比除了性能大幅提升外(提高135%),能耗也降低了40%。不过Woodcrest处理器的功耗随主频的变化也有不小的差异。


    Woodcrest处理器分为标准版和低电压版两种。标准版主频从1.6GHz到3GHz,其中1.6GHz到2.66GHz产品的TDP(Thermal Design Power,热设计功耗,当处理器达到最大负荷时候的功耗)为65W,最高主频的3.0GHz产品TDP值为80W,而低电压版2.33GHz产品(今年第三季度发布)TDP值仅为40W。从英特尔未来服务器处理器功耗路线图(参见附表)来看,其长远目标是将DP产品的主流处理器产品的TDP控制在80W,而LV产品的TDP值将保持不超过40W。


平台: 关注功能提升


    尽管最新发布的Woodcrest处理器创下了多项X86服务器的性能新记录,但这仅仅是冰山之一角,应该说其负载的平台更值得关注。


    今年5月,英特尔在深圳IDF上正式推出了Xeon DP服务器平台??Bensley,其搭载的芯片组开发代码为Blackford和Greencreek,即5000系列芯片组。其中Blackford系列面向服务器市场,包括5000P和5000V两款芯片组,Greencreek面向工作站市场,正式命名为5000X。


    从技术特性来看,Bensley平台比上一代平台有了多项增强,其中双独立前端总线和全缓冲DIMM(Fully Buffered DIMM,FBDIMM)都是第一次出现在英特尔的服务器平台上。Bensley平台不但支持目前的Dempsey和Woodcrest处理器,其硬件辅助虚拟化(VT)、iAMT、I/O加速(I/O AT)等多项平台技术还将延续到下一代服务器平台上。因此,Bensley堪称一款承上启下的服务器平台,其技术基因对英特尔未来服务器的发展方向有着重要的深远意义。


两项新技术提升系统性能


    支持双独立前端总线和FBDIMM内存对Bensley平台性能的提升有至关重要的作用。


    5000系列芯片组支持双独立总线,这是与之前的75××和72××系列Xeon DP平台芯片组最大的不同。正是这一特性减少了双核处理器对前端总线的争用,处理器和内存之间的数据带宽得以比以前有了很大的提高,同时FSB的频率提升到了1333MHz??在Bensley平台上,50××处理器最高能够支持到1066MHz,51××处理器则能达到1333MHz的速度。在双独立总线下,处理器对外的数据带宽分别达到了17GB/s和21GB/s。


    不过,5000系列芯片组与上一代产品最大的区别还是提供了对FBDIMM内存的支持。


    其实,FBDIMM并不是一种新型的内存规格,而仅仅是一种新型内存连接架构,其本质上是一种串行内存工作方式: 在普通的RAM芯片(目前采用的还是DDR2内存芯片)中间通过一块缓冲芯片AMB(Advanced Memory Buffer)模块连接,AMB与北桥芯片中的内存控制器连接。


    在这种新型模式下,DRAM芯片不再直接与内存控制器进行数据交换,而是通过AMB来执行,DRAM之间数据交换也从传统的并行连接变成了串行连接(在同一模组内还是并行连接)。数据读出和写入操作可以在一个周期内同时进行,相当于将内存系统的延迟时间缩短了一半。 


    这是一种串行接口多路并联的设计,与PCIe的工作特点很相似。由于采用串行连接,可以用更少的引脚建立更多的内存通道,避免了传统DIMM模组间所谓的“短线连接”电阻抗不连续的弊端,还可以使通道内的芯片容量大幅度增加,从而扩大了内存子系统的容量,这对服务器系统来讲是很重要的。


    FBDIMM对现有的DDR2内存技术不需要做改动,仅仅增加AMB模块即可,因而进入市场的障碍降低了很多。当内存规格发生变化时,FBDIMM只要调整AMB就可以保证内存控制器不变,大大增加了系统的灵活性。


    目前Bensley平台支持533MHz/667MHz FBDIMM,配合双独立总线,使内存通道增加为4条,可以充分利用1333MHz的总线吞吐能力。


性能和功能一个都不能少


    从技术角度来看,平台化战略有一个重要的基础: 未来摩尔定律带来的晶体管数量增加不仅仅用于性能提升,更重要的是还要带来功能的增加。


    与上一代平台相比,Bensley集成了更多的功能。而伴随着Xeon处理器从双核逐渐向多核演进,服务器平台还将承载更多的重任。