在笔者看来,于2010年3月正式发布的IBM eX5服务器应该是自英特尔发布基于QPI总线架构至强处理器平台以来,最有特色的产品。其独特的第五代X架构(简称X5)的种种新特性可谓惊艳全球,同时也为其打上了强烈的差异化的烙印。进入2011年,伴随着英特尔发布新一代与Nehalem-EX(至强7500)引脚兼容,最高达10核心的32nm的Westmere-EX(至强E7)处理器,IBM的eX5也迎来了崭新的一代,我们又将对其有怎样的期待呢?
首先,我们必须要说这种鲜明的差异化设计,让IBM eX5服务器在2010年取得了辉煌的成绩。自2010年首发至今,eX5服务器已经先后取得过24项业界标准化测试的冠军,其中很多都是重量级的测试,这是一个相当了不起的成绩。而在另一方面,在eX5的带领下,IBM在2010财年的高端x86市场取得了市场第一名,同比增长0.8%,而到了2011年第一季度,双插槽的x3690X5服务器居然卖断货了,并且基于X5架构的HX5刀片服务器也成为了IBM有史以来销售最好的4插槽(通过级联扩展)刀片服务器。
如此耀眼的业绩,无疑为eX5服务器在2011年的表现打下了坚实的基础。而英特尔的与上一代至强7500引脚兼容的最新10核心至强E7处理器,显然将让eX5如虎添翼。有关英特尔至强E7处理器的情况,我们不在此过多介绍,ZDNet已经有很多介绍,这款基于32nm工艺的处理器,在提高主频并增加两个内核与相应的缓存之后,相较于上一代至强7500处理器,综合性能可提升高达40%,因此我们就可以大概想像一下采用E7的新一代eX5在性能将会有怎样的表现。
至强E7处理器一览
英特尔至强E7处理器一览
这里值得一说的是,eX5仍然保持了良好的处理器的支持特性,而不像某些厂商的同级产品,在CPU型号上有着很大的限制。从下面的对比中,我们就可以看出为。
新一代x3850X5服务器所支持的至强7500与E7处理器列表,除了双插槽处理器(至强6500和E7-2xxx)外,几乎支持所有的E7和至强7500处理器
某款8插槽至强7500服务器只能支持4款至强7500/6500处理器,不知到了E7会支持几款
新旧eX5服务器差异
事实上,新一代eX5服务器相较上一代不仅仅表现在处理器的更新换代方面,在很多外围核心组件与设计方面均有较大的改进,使得新一代eX5的企业级关键业务性能得到了进一步的提升。
从上面的介绍中,我们可以看到新一代eX5服务器在可扩展性、可靠性以及SSD(固态盘)存储方面得到了明显的加强,同时利用eX5服务器在内存扩展方面的独门绝技,在新一代eX5服务器上,不仅仅只是专注于硬件,还与业界的著名的企业级应用进行有效集成,从而为客户提供了高级解决方案。
MAX5内存扩展优化
原先设计中的通过EXA芯片(即MAX5内存扩展性能优化中心)进行级联扩展功能终于实现,但请注意最终的生效日期,基本上集中在5月底至6月中旬。在2010年已经购买的eX5服务器也将拥有同样的EXA级联扩展能力,具体事项可以咨询当地IBM eX5服务提供商。
级联扩展
级联扩展是eX5服务器一个重要的特性,可谓全球独一家,它通过QPI可以巧妙的将一台双插槽服务器变成4插槽服务器(x3690X5),或是将一台4插槽服务器变成8插槽服务器(x3850X5)。注意,变身之后的x3690X5与x3850X5仍然是一台服务器,而不是两台服务器的集群。这种能力对于满足客户不断增长的业务需求极为有用,它可以让用户平滑的、按需的使用自己的采购预算。而在设计规格中,除了QPI,还可以通过MAX5内存扩展性能优化中心上的IBM独家研制的EXA芯片进行级联,这样在保留平滑扩展的优势同时,还带来了MAX5的内存扩展的优势,不过这个技术是通过IBM自己的EXA总线而非QPI来完成。在2010年发布eX5服务器时,IBM当时强调EXA级联扩展还不可用,预计要到2010年晚些时候,现如今这一功能终于实现,用户可以真正享受海量内存+级联扩展所带来的优势了。而且,新一代eX5所采用的DIMM的最大容量也将提高一倍(机架机型可支持32GB的DIMM,刀片机型由于DIMM的高度限制,支持16GB的DIMM),当采用32GB DIMM时,两台x3850X5+MAX5的级联将为用户提供8插槽E7与6TB内存的应用平台,比其他8插槽平台足足多出了2TB的内存空间。
需要指出的是,为了保证级联的性能不受损失,IBM还在独自开发了XceL4v动态服务器缓存。当一台eX5服务器(一个节点)连接MAX5内存扩展性能优化中心时,并不会产生这一缓存,而当两个节点+MAX5级联后,就会在主机内存中生成256MB的L4缓存,有于两个节点进程间的通信,以保证数据的同步。如果是两机级联,则总共有512MB的L4缓存 ,而这占用的缓存并不会使性能受到损失,相反在级联模式下,它将有效的提高距离较远CPU间的数据传输,使性能看上去就像是单机箱的服务器。
在存储一项中,我们可以看到eXFlash极速套件中,原来的50GB的SLC SSD换成了50GB的MLC和200GB的MLC SSD。随着NAND闪存的进步,MLC的性能与寿命也已经得到了全面的进步,因此对于这种改变,无需大惊小怪,而200GB的容量,对于1.8英寸SLC设计的SSD,显然是很难达到的。因此全面换用高性能的MLC SSD,在保证应用容量、性能的同时,也将使得采购成本得以下降,对于用户来说是一种双赢的改进。
新一代eX5服务器加入了PCIe SSD卡的选项,IBM称之为IBM High IOPS SSD PCIe(从图中可以看出是OEM自著名的PCIe SSD厂商——FUSION-IO公司)
另外,IBM在新一代eX5服务器上,为有更高性能需求的用户准备了业界最高性能等级的,采用PCIe接口的SSD可选配置,其最高640GB的容量以及足矣替代上千块SAS硬盘所组成的阵列的,高达200000 IOPS(320GB和160GB的型号为100000 IOPS)的性能,为eX5服务器提供了当前业界顶级的IO性能。
IBM的Memory ProteXion技术提供了比同级E7服务器更高的内存容错能力
在提高可靠性方面,IBM在其EXA芯片上采用了Memory ProteXion技术,它是一个巧妙的内存冗余技术。传统的ECC内存采用72bit数据,其中用户数据为64bit,但事实上ECC只需要6bit的空间即,所以还剩余2bit,Memory ProteXion就是利用了这2bit的空间提供了内存的冗余数据位。当在每天进行的内存清理(Memory Scrubbing,也是IBM的一项内存检测技术)测试中,若发现某一数据位已失效,那么Memory ProteXion就会重新调整数据的存储路径至冗余的数据位。
Memory ProteXion是IBM在EXA主控芯片方面一个重要功能,这也使其MAX5内存扩展性能优化中心获得了高可靠性的保证。需要强调的是,Memory ProteXion技术并不是ChipKill,后者是一种高级的ECC数据写入策略,它将ECC的单位从一个芯片扩展至一个物理Bank,即跨越多个芯片来做总体的ECC,就像RAID5阵列那样,一颗芯片(相当于阵列中的一块硬盘)出问题后,仍然可以依靠其他芯片上的数据工作,就相当于把那颗块芯片“杀死”一样。MAX5扩展器同时支持ChipKill与Memory ProteXion,以及其他的高级内存容错功能(如内存备用、内存镜像等),从而在可靠性方面有着充分的保证。比如实现双内存芯片失效保护功能(这是英特尔在安腾处理器上才提供的RAS功能),因为ChipKill可以保证其中一颗芯片失效无碍,而Memory ProteXion则可以保证另一颗芯片的地址位失效也没有问题。但是,由于服务器内的内存听命于处理器上的内存控制器,而E7与至强7500并不支持Memory ProteXion,所以eX5服务器本地内存并不具备数据位冗余保护的功能。
最终价值体现
当我们了解了eX5的种种关键特性之后,就能明显的看到其对当前企业级关键业务应用的贡献。全球信息化处理的最终的结果,其实都体现在数据上,而对于数据的检索与读取也将是一个越来越繁重的基础性操作。当数据积累得越来越多,数据库日益庞大之后,用户(也可以说是应用)对数据反应的速度的要求与基础平台执行速度之间的矛盾也日益突出,也因此硬件厂商与应用厂商都不约而同的寻找着最佳的思路。
目前在企业IT应用中,来源于底层的瓶径已经对最终的应用效率与性能产生了越来越多的制约
纵观当前的企业IT应用环境,处理器性能提供的性能已经明显超过了外围数据I/O与内存空间所提供的支持,瓶径也就此产生,而当我们将要迈向云计算时代的时候,就会发现随着应用的集中、数据的集中,在关键业务环境中,需求(处理器)与供给(外围组件)的矛盾绝对是不减反増,因此打破这一瓶径已经是必经之路,但怎么打破呢?基于工业标准化设计的x86处理器平台,在迎来点对点互联与内存控制器集成架构之后,留给厂商自由发挥的空间已经确实不多了,然而这也更好的反衬出了IBM的eX5服务器差异化设计的惊艳之处。
eX5服务器带来客户的最终价值可以体现在三个方面,即由MAX5带来的强大的内存扩展能力,在为用户(应用)提供海量内存的同时也节省了用户的开支(不用为了扩展内存而再去增加处理器);由高速的eXFlash SSD所带来的高速IOPS的响应能力,保证了IO效率;由独特的级联扩展能力所带来的平滑可扩展的优势,我们可以看到这三项均有效的缓解了上面所提到的瓶径,从而为企业级关键应用提供了强大而广阔的驰骋空间。
与HANA的集成方案
无独有偶,在应用层面,厂商也在考虑如何通过自身的设计来将性能最大化。从带宽和响应能力上,当今最强大的数据存取设备无疑就是内存,那么如果将内存虚拟为一个磁盘,并在此基础上运行应用呢?即将尽可能的关联数据都放在内存中,以保证最好的响应性能。对于这种技术,肯定会有不少说早已经有了,比如DOS时代的RAMDISK,不过那只是一个简单的虚拟盘的应用,并没有与应用进行紧密的结合,而且完全没有应对服务器群集的解决方案。不过,现在这种“内存计算(In-Memory Computing)”理念终于在企业级应用中实现了,第一个成果就是来自SAP公司的高性能分析应用(HANA,High-Performance Analytic Appliance),通过上面的简单的原理介绍,我们很容易看出HANA对服务器的需求——内存容量以及能与内存速度相匹配的IO能力,也因此,IBM宣布其eX5服务器为业界唯一通过SAP认证的HANA机型也就不足为奇了,我想这也算是一个“英雄所见略同”在IT应用与硬件结合中的典型吧。
eX5服务器与HANA的集成方案,提供了单机、级联和集群的多种选择
目前,在eX5服务器家族中,只有x3690X5与x3950X5(3950X5是在3850X5基础上针对部分应用进行定制优化的型号)两款服务器纳入到了HANA合作计划中,之所以没有考虑HX5,是因为HX5在存储性能上还无法与采用8枚1.8英寸eXFlash SSD联装套件的机架服务器相比(x3950X5可以配置两个eXFlash套件共16块SSD,x3690X5可达3个,共24块SSD,此外4U的高度也为x3950X5做好了支持性能更强大的PCIe SSD的准备),所以恐怕在IO方面无法与恐怖的内存计算的需求相匹配。但IBM表示,将会根据客户的需求来考虑未来的机型配置,如果有强烈的市场需求,不排除会在HX5上加入HANA合作计划。
HANA合作计划中的5大主力eX5机型,注意其内存与存储方面的配置
HANA合作机型中,上文提到的IBM High IOPS SSD PCIe卡标配,但由于是标高PCIe插卡形式,所以在刀片和2U高度的x3690X5上无法使用。在内存容量方面,均只使用了CPU一半的DIMM数量(每个内存通道上插两个DIMM),以方便用户日后进行扩展。而在DIMM容量上,都是16GB,IBM表示这是因为考虑到日后对内存容量和一DIMM一致性的需要,如果采用8GB DIMM将明显限制最终的扩展容量,而32GB DIMM现在价格还是太贵。
综上所述,面对共同的性能追求,我们相信越来越多的应用将在通过基础硬件平台内存与IO方面的重要改进而获益的同时,相关的应用厂商也会关注到这一趋势的变化而有针对性的优化他们的产品与解决方案,最终将为用户带来更完美的体验,而eX5服务器凭借着其独特的设计,无疑将在一趋势中愈加耀眼,并将推动这一潮流让更多的用户享受到更佳的应用性能,就让我们静观在2011年,x86关键业务应用市场将会有怎样的改变吧!x86服务器技术革命 IBM eX5架构揭秘