英特尔至强E5-2600 v2带来哪些性能提升

时值金秋,英特尔也依照惯例如约发布了“Ivy Bridge-EP”至强E5-2600 v2服务器处理器。那么,这一新的处理器系列与现有“Sandy Bridge-EP”至强E5-2600 v1芯片相比存在哪些优势?服务器制造商又会在这片略显平淡甚至有所萎缩的市场上给客户带来哪些惊喜?

可以肯定的是,他们必然是下了一番功夫的。

至强E5-2600 v2处理器被认为是一款“TICK”级生产工艺进化的产品,基本不会改变服务器的设计。但在新系列三款芯片(六核心、十核心以及十二核心几种完全不同的布局)的影响下,处理器不仅应用了更多“TOCK”和“TICK”,还增加了核心数量。其实际工艺与架构都与前代单片八核心Sandy Bridge-EP都存在明显差异。

好消息是,三款E5-2600 v2芯片采用的都是与前代v2处理器相同的插槽而且具备同样的散热设计,这意味着服务器制造商不必在新CPU的生产过程中对工程方案做出过多变更。另外,由于三款新产品采用更为平衡的缓存机制、主内存带宽和更多核心数量,服务器制造商将能够根据特定工作负载拿出定位精准的定制化芯片SKU.

不过双插槽设备领域的两大芯片家族之间仍然存在明显差异,因此我们很难对二者的性能以及性价比在芯片与系统层面做出直接比较。英特尔并没有针对其芯片给出相关性能指标,我们在很大程度上只能通过来自服务器合作厂商的基准测试来评估特定系统的处理能力。

有鉴于此,我们采用了一种非常粗略的比较机制,用于衡量至强E5-2600 v1与v2两大家族在性能与性价比方面的表现。但我们的方法其实是将各芯片的总体时钟速率直接按各芯片价格进行划分,这种算法显然不是特别科学。

除非日常事务涉及频率极高的事务处理或者高性能计算需求,否则客户不太可能单独购买处理器产品。客户往往会直接购买整体系统,并希望从系统层面了解不同方案之间的性能差异以及价格给系统带来的配置变化。

惠普正在自家的ProLiant Gen8系列产品中广泛普及至强E5-2600 v2处理器,其中包括ProLiant DL350、DL360以及DL380机架、BL460刀片设备以及SL230、SL250以及SL270高密度设备。惠普公司服务器业务部门营销副总裁Jim Ganthier表示,在某些情况下,Ivy Bridge-EP SKU的实际使用成本可能会稍高一些,不过惠普拥有一系列其它“系统配备机制,能够有效冲抵由此带来的成本提升”.

他所提到的“机制”之一就是惠普协同多家内存厂商所设计的三级式DIMM内存条。这种内存条的额定电压为1.35伏,能够将24GB容量塞进一根成本与16GB DIMM相同的内存条当中。24GB条的额定功率比普通16GB内存降低了35%,性能却提高了25%.

“其实二者在价格上没有什么区别,”Ganthier在谈论分别采用v1与v2处理器的ProLiant设备的售价时指出。“新处理器来的价格增量微乎其微,但性能改进却相当明显。”

目标客户群是那些仍在使用搭载至强5500或者更早期处理器的ProLiant设备的用户们。他们的装备实际上已经使用了四年多、这在服务器领域看来已经算是“年迈”的征兆了。

惠普确实为那些仍在使用ProLiant、SL6500以及SL2500 Gen8的客户准备了处理器升级方案,并利用针对Gen8开发出的SmartSocket机制(不必改变针脚布局),帮助那些打算变更插槽的客户愿望成真。“我们目前的大部分系统都将替换为新产品,”Ganthier表示。“这很正常,因为没有多少用户喜欢用拆卸重组的方式对服务器进行升级。”

超级计算机制造商Cray营销副总裁Barry Bolding裁预计此次新处理器的出炉也将给其产品带来全面升级。各方面在数个月之前就已经拿到了新芯片的供货协议,但到现在产品才真正开始投付生产并出货。

与惠普相近,Cray并不希望自己配备“Aries”XC互连系统的高端XC30设备的价格有所改变,同时也不希望为传统的CS300集群(配合Appro公司所推出,主要利用InfiniBand互连机制实现节点间的连通)改变售价。不过该公司仍然期待新的SKU能为自家系统带来令人欣喜的性能提升。

“我们高兴地看到,英特尔新至强并不只是对时钟频率或者计算核心做出升级,”Bolding指出。“而是利用均衡化思路对缓存及带宽进行升级。”

在XC30超级计算机方面,Cray公司只支持八核心至强E5-2600 v1处理器,而在v2芯片方面则只支持十核心与十二核心处理器版本。CS300产品线对SKU的支持范围要比XC30广泛得多,但对于并行类工作负载,客户可能更倾向于使用高核心数量的处理器而非更高时钟速率。

Bolding表示,在一般情况下,如果大家的工作负载对内存容量要求很高–例如复杂的流体力学应用程序–那么十核心Ivy Bridge-EP更适合各位。如果大家的工作负载对内存容量要求并不高–例如计算分子动态或者模拟其它生命科学环境–那么十二核心芯片的表现会更出色。

那么Cray公司的设备在由至强E5-2600 v1芯片向v2方案升级后能带来怎样的具体运算能力提升?如果以XC30设备为参照,搭配v2芯片之后其浮点运算能力将达到每秒99万亿次,而使用v1芯片则只有每秒66万亿次;而低密度风冷版本XC30-AC设备在v2芯片的支持下的运算能力为每秒33万亿次,而搭载前代v1芯片则只有每秒22万亿次。CS300在使用新芯片后可提供每秒41万亿次计算能力,但与前代至强E5-2600配合的性能则只有每秒28万亿次。

在此提供一条经验法则,CPU本身代表着约两成到三成的系统整体成本,具体比例取决于设备的实际架构。对于普通的计算主机来说,这一比例相对较高;对于超级计算机而言,这一比例则相对较低–这主要是由于Aries互连等精密方案带来的高成本。因此,如果处理器价格进一步提升10%或15%(同时带来40%到50%的每秒浮点运算处理能力),系统价格受到的实际影响就可能微乎其微–从系统层面来看也许只在2%到5%之间。

SGI公司建议客户将关注重点放在新芯片给其ICE-X方案每套机架所带来的约40%总体性能提升方面。而且相比之下,其ICE-X与Rackable设备(其设计初衷在于为超大规模数据中心运营商提供硬件配置方案,但后来又转向Hadoop大数据与NoSQL数据存储领域)的价格从系统层面来看只上升了一丁点。SGI同时表示将把新的至强E5芯片纳入其Modular InfiniteStorage磁盘阵列当中。

SGI公司产品营销副总裁Bill Mannel指出,目前其客户可以根据CPU成本所占比例的差异进行二八划分,因此大部分客户都不会因为芯片的价格上涨而感受到明显的系统价格提升。

毫无疑问,SGI公司在未来的这段时间内将翘首期盼至强E5-4600(Ivy Bridge-EP衍生版本),并将其作为自家“Ultraviolet” UV 2000共享内存系统的绝佳性能提升手段。英特尔并没有为专门针对低成本四插槽服务器的至强产品线新成员们的上市制定明确日程规划,但SGI则通过利用芯片上额外的QuickPath链路与其自有的NUMALink 6互联系统相对接,将双插槽的节点进行整合。