近几个季度,全球服务器出货量和收入都在不断缩水。而在服务器市场的持续低谷中,x86服务器的市场表现比其他平台表现要好很多。这其中主要有几个方面的原因:一方面,云运营商倾向于购买更廉价的机器,同时,服务器虚拟化技术的应用不断广泛,再加上强大的摩尔定律带来的产品更新速度,以及全球某些经济活跃的地区支撑。
近日,英特尔公司在旧金山的IDF上宣布推出英特尔 至强 处理器E5-2600 v2产品家族(代号为“Ivy Bridge-EP”)。9月11日,英特尔在北京召开媒体发布会,来自英特尔(中国)有限公司服务器平台产品经理罗一峰介绍了E5 v2的产品特性。同时,来自搜狐的研发中心高级主管彭毅介绍了E5 v2在搜狐的测试和应用情况。
平衡性能和每瓦性能 降低大型数据中心TCO
“功耗是每个大型数据中心运营成员非常敏感的话题”,搜狐彭毅在演讲中谈到,在保证业务性能不变的情况下,降低能源消耗,对于IDC运营来说是非常好的收益和惊喜。彭毅表示,搜狐在测试中惊喜地发现,功耗相对于上一代产品降低了15%-30%,从原有的Nehalem平台到E5-2600 v2平台,TCO降低了66%。
据罗一峰介绍,基于服务器制造商的早期基准测试结果,相比2012年3月发布的Xeon E5-2600 v1产品系列,新的Xeon e5 – 2600 v2将会带来超过50%的性能提升,每瓦性能将会提升45%。这些性能数据是基于SPECVirt_sc2013测试,每瓦性能是基于SPECpower_ssj2008测试。当然,在实际应用中,性能和每瓦性能会有所不同。
【图3】Xeon E5 v1 和v2 基本特性对比
我们知道,制程工艺的改进会带来相同功耗下性能的提升,也就是每瓦性能的提升。刘一峰介绍到,从32nm到22纳米3D三栅极晶体管制程,同样的性能下能耗降低在晶体管层面是50%。
只是在性能方面如何平衡?在制程变为22nm之后,Xeon E5-2600 v2将会通过更多的核数、更大的三级缓存等特性来维持并提升32nm 的E5-2600 v1所具有的性能。
一方面,如上图所示,最高端的Ivy Bridge-EP处理器有12个核心数,相比之前的8个核心数提升了50%,三级缓存方面,Ivy Bridge-EP可以高达30MB,相比之前的20MB也提升了50%。
另一方面,顶级Xeon E5-2600 V2的基础频率和睿频之后的最大频率可以达到200MHz,在时钟频率仅仅提升了6.1%。增加的时钟速度基本上弥补了核数从8提升到12核所带来的额外延迟。
同时,50%的性能提升还源自于一些其他的改进。从上表我们可以看到,内存方面,主内存现在运行速度也有所提升,1.35v时的内存速度从之前的 1.333GHz上升到1.6GHz,1.5V时的内存速度从之前的1.6GHz上升到1.87GHz。主存储器容量也翻了一番,从768GB上升到 1536GB。(通过在2路系统的24插槽中使用64GB针口)。
Ivy Bridge-EP家族还使用了不同的SKU来支持不同的QPI通道,提升点对点互联速度,QPI端口数量仍然是2个。
在处理器中,通过SMT虚拟化指令通道,因此,它可以同时兼顾两种指令流,因此可以处理更多数量的任务。(当然前提是你的工作负载是HT友好的)。
指令集方面也有了一些改进,前几代的至强,程序员使用做复制/粘贴操作要自己写汇编程序,现在有一组指令MOVSB / STOSB,也就意味着程序员不必再纠结于汇编,可以直接调用这组指令来做复制/粘贴。计算核心现在也已经可以通过用户线程快速访问寄存器组,这是针对具有高线程数的工作负载的一个优化。Ivy Bridge核心还包括“牛山”随机数发生器,称为SecureKey。
三种原生芯片核心 首次针对不同负载优化硬件
在Ivy Bridge-EP中,另一个非常新鲜有趣的事情是,Ivy Bridge-EP处理器不止一个版本,而是有三种不同的原生芯片版本,每一种不同的芯片是针对特定的工作负载优化的,支持的核心数、内存控制器、缓存尺寸、频率也会有所不同。
【图4】6核、10核、12核三种不同的 Ivy Bridge Xeon E5处理器
第一种Ivy Bridge Xeon E5包括了4个或6个核心、PCI-E和QPI连接,以及一个四通道内存控制器。主要针对低能耗和低工作负载设计和优化的,不适用于高频率的工作负载。它有15 MB的三级缓存,热功耗在40到80瓦之间。核心、缓存、QPI连接和PCI控制器挂接到两条环形总线上,就像 Sandy Bridge-EP一样。
第二种Ivy Bridge Xeon E5,主要是针对双路服务器市场,提供了6核、8核、10核三种版本,25MB三级缓存。同样是两条环形总线将核心组件连接起来。处理器的功率达到70-130w,适用于低功耗高频率的用户和不同类型的工作负载。
第三种类型的Ivy Bridge-EP处理器是不折不扣的12核心野兽,提供了115w和130w两种的选项。英特尔已经取消了135W的服务器SKU,但保留了150w的工作站版本。这个芯片有3条环形总线来连接计算核心、缓存和晶片上的其他组件,并且,内存控制器也是分为两个,但是有一半的通道分别挂在两个控制器上,这就使得每一个插槽同样是四个通道,跟前两个版本的Xeon E5-2600 v2 一样了。
【图5】 Romley服务器平台设计时采用 Ivy Bridge-EP的部分