剖析AMD Istanbul的虚拟化功能

AMD在6月1日发布了面向服务器的Opteron 2400(适合2路系统)/8400(适合4路和8路系统)系列,也就是我们所说的Istanbul六核CPU。

适用于4路以上服务器的HT Assist功能

 

这次发布的Istanbul六核Opteron新增加了一项名为Hyper Transport(HT) Assist的功能。

Istanbul新增的HT Assist是Opteron 4路处理器一大优点。Istanbul双路处理器也提供了这一功能,并且可以通过BIOS关闭

在多路服务器中,当某个CPU运行的时候可能会需要另一个CPU本地缓存中的数据。Shanghai四核Opteron对每个CPU采用"广播"的方法来发送信号,查看其他CPU中是否本地缓存请求的数据。

如果是2路服务器的话,只能限制与另外1个CPU进行通信。不过,如果是4路或者8路服务器的话,各CPU之间可以进行频繁广播通信,这大大增加了各CPU的超线程通信量,最终导致超线程性能的下降。

这时候可以将CPU三级缓存(6MB)中的1MB用来作为每个CPU的数据目录。这就是HT Assist技术。

由于采用了HT Assist技术,AMD将4路系统的超线程性能提高至41.5GB/s,比Shanghai的超线程性能提高了将近60%(没有采用HT Assist的时候是25.5GB/s)。

HT Assist在2路系统中无法发挥在超线程性能方面的优势。随着系统插槽数的增加,HT Assist的优点才逐渐显现出来。可以说,HT Assist是一项主要面向4路和8路大规模数据中心服务器的功能。

Istanbul Opteron的内核数增加到6个,但是各内核三级缓存的6MB容量并没有增加,反而要为新增的HT Assist功能分配1MB的容量。AMD解释说,因为Istanbul的内核数增加,并且拥有6MB的大容量三级缓存,所以即使为HT Assist分配了1MB的容量也不会造成性能的下滑。

内核数增加有利于虚拟化

Istanbul Opteron对于使用2路系统的企业来说有诸多好处。虽然新增的HT Assist功能对2路服务器来说在性能方面没有太大优势,但是内核数从4个增加到6个非常有利于服务器虚拟化。

在虚拟化方面,虚拟环境中同时运行的CPU内核超过一定限度就是造成服务器整体性能的下滑。至少有一个物理CPU内核被分配到虚拟环境中以满足整体性能的需求。

对于Istanbul来说,2插槽×6核=12核,而对于Shanghai来说,2插座×4核=8核,CPU内核数增加了1.5倍,粗略计算的话,Istanbul Opteron可以支持1.5倍的虚拟环境。

而且,Istanbul Opteron和Shanghai Opteron采用了相同的CPU插槽和电学特性。当然,因为两者的TDP(热量设计功耗)也是相同的,所以Shanghai CPU和Istanbul CPU是可以相互替换的。因为热设计也是相同的,所以不需要变更服务器自己的冷却装置或者机房空调。

这对在国内运行服务器的用户来说,最大的好处是不需要变更冷却和电源装置。

 

Istanbul 6核CPU,与Shanghai的功耗相同,因为热设计相同,所以只需要更换CPU就可以得到1.5倍的性能

如果你正在为现有基于Shanghai Opteron处理器的服务器性能不够而苦恼的话,那么你可以购买来Istanbul Opteron直接替换Shanghai Opteron处理器,就可以将性能提高1.5倍。

原来一个配置了314个单核Opteron处理器(2003年发布)的服务器系统性能现在只用一台配置有21个Istanbul Opteron处理器就可以实现。虽然性能相同,但是比2003年的服务器在能耗上削减了将近95%。

 

Istanbul与Shanghai处理器的定价

Istanbul与Shanghai的性能对比

Istanbul Opteron处理器比2003年发布的Opteron处理器性能更高、更省电

Intel在去年发布了代号为Dunnington的至强7400六核处理器,所以Istanbul并不是全球首款六核CPU。但是考虑到至强7400主要是针对4路大规模服务器和高性能计算,因此采用多个面向2路服务器的六核CPU在性能和成本方面都有很大优势。

2010年Opteron将有重大变化

AMD将在2009年下半年发布最新面向服务器的芯片组SR5690(北桥)和SP5100(南桥)。据AMD称,名为Fiorano的平台集成了这些芯片组和最新Opteron处理器。

 

2010年的Opteron处理器将升级到直连架构DCA 2.0、虚拟化AMD-V 2.0和电源管理AMD-P 2.0

直连架构DCA 2.0,不仅CPU内核数增加,内存速度和超线程速度也有所提高。而且,CPU的缓存容量也提高了2.2倍

AMD-V 2.0中增加了I/O虚拟化功能IOMMU,AMD-P中则增加了APML(Advanced Platform Management Link)

SR5690的最大特点是支持I/O虚拟化功能IOMMU。这项功能可以在访问网络存储的时候减轻CPU负荷,实现更高效的访问。同时,南桥SP5100支持传输速度达到5.2G/s的HT 3.0、PCI-E和热插拔功能。

但是AMD方面认为,因为AMD要到2010年才会发布新一代的Opteron处理器,所以目前Fiorano还不会太普及。

因此有不少厂商向AMD询问是否会提前发布Fiorano平台,还有接下来的Maranello平台和San Marino平台。

在Maranello/San Marino平台中,CPU插槽也有所变化。虽然现在AMD采用的是Socket F,但是未来Maranello和San Marino平台将分别采用Socket G34和Socket C32插槽。

这是因为从这一代的Opteron开始内存方面有所变化。现在的Opteron支持的是双通道DDR2内存,而到了Magny-Cours将支持4通道的DDR3内存,因此内存带宽一下子提升到现有Opteron的两倍多。不过,Lisbon将支持双通道DDR3内存。

Magny-Cours和Lisbon的区别除了内存通道之外,CPU内核数也是不同的。Lisbon是4核或6核的处理器,而Magny-Cours集成了Lisbon模片,因此可实现8个或者12个CPU内核数。

图9

AMD将在2010年以后发布面向服务器的Opteron 4000系列(Lisbon)和高端Opteron 6000系列(Magny-Cours),在这期间没有8路产品的计划

AMD将在2010年以后发布代号Magny-Cours的Opteron 6000系列和代号Lisbon的Opteron 4000系列两种面向服务器的CPU产品。

同时,Magny-Cours主要面向4路以下的系统,不像Istanbul那样支持8路服务器设计。

2010年以后的AMD Opteron路线图。Opteron 6000系列是搭载了两个Opteron 4000系列模片的CPU

计划在2010年推出的Magny-Cours的性能是Shanghai的3倍,计划在2011年推出的Interlagos是Shanghai性能的4倍

AMD计划在2011年推出采用32纳米制程技术制造的6至8核心Valencia处理器和12或16核的Interlagos处理器。到2011年之后,GPU的矢量运算功能将被集成到CPU中。到那时候,如果使用GPU的运算单元将成为虚拟化的一个巨大挑战。

如果只是考虑虚拟化的话,用性能提高1.5倍的Istanbul替换现有服务器的CPU是有很大好处的。计划在2~3年之后采购新服务器的企业可能会更关注Magny-Cours和Lisbon处理器。

当然,2010年以后的服务器大多数将是基于多核CPU的,同时固态硬盘也将取代低成本的SATA硬盘用来保存数据。如果这样的话,2010年~2011年对服务器来说将成为一个重大的转折点。