英特尔“急”推至强5600:用户推动还是定律使然?

2009年3月31日,英特尔在中国正式发布至强5500处理器。

2010年3月17日,采用32nm制程的英特尔至强5600处理器如约而至。

带着巨大性能提升和性能功耗比的两代产品,发布时间仅仅相隔不到一年,使得不同的媒体在不同的场合不禁问了同样的问题:至强5600的到来是不是有些太快了?

面向企业级市场的至强5×00系列处理器,在2007年11月推出首款采用45nm制程工艺的至强5300处理器之后,英特尔将近沉寂了将近一年半,才推出了过去一年大放异彩的至强5500,而现在,仅仅不到一年,至强5600便迫不及待的来了——不断加快的产品升级换代速度,与显然不能与之相匹配的企业级用户采购翻新服务器速度,形成了巨大的反差。

从公开的统计数据来看,英特尔完全没有必要这么快就把至强5500拉下马,毕竟,IDC公布的2009年第四季度中国X86市场的排名中,英特尔架构已经占据了95.1%,达到了历史最高水平;从性能提升程度上来看,与单核服务器1:8的替换比足以让至强5500拥有全部的单核和双核服务器替换市场——即使是从竞争对手的层面上来看,AMD的新处理器仍然要等上至少一个月,而谁先发布新品并非取胜用户的关键。

为何英特尔如此“着急”的将至强5600推上前台?如果说3月底即将发布的至强7500,将替换的是两年半以前的产品,属于正常的更新换代。那么,替换仅仅一年前发布还上有余温的至强5500,又是何故?

难道,英特尔只为了证明创始人之一的戈登·摩尔所创造的“摩尔定律”?抑或是证明英特尔有足够的能力履行许下的Tick-Tock诺言?

从摩尔定律到Tick-Tock:至强5600今日降临的必然

过去的45年,摩尔定律一直在支持着无数半导体行业的梦想家前进,而英特尔的每一步也都在印证着摩尔的高瞻远瞩,当时钟拨到了43年之后,英特尔提出了如今已经广为人知的Tick-Tock战略:Tick年提升制程,Tock改善微处理器架构,两年便完成一个周期——无数的人并不相信,英特尔能够在一年内做完提升制程或是改善架构中的任何一件事情,但是现在,英特尔以实际行动证明了其许下的诺言。

因此,英特尔(中国)有限公司服务器平台事业部产品经理贺晓东在面对文章开头的问题时承认,英特尔推出至强5600有一定的因素来自于Tick-Tock的承诺,来自于“传承延续摩尔定律”,而且,这样的每年只做一件事情——“每两年做一个架构的提升,中间穿插着每两年是工艺的提升”,中间会有平滑的过度区域,风险会比较小,毕竟,“同时做架构的提升和制程工艺的提升,这样风险会很大。”

但正如我们的老朋友顾凡所说,延续摩尔定律和保证Tick-Tock,都不是英特尔的主要任务,英特尔的主要任务是“保障用户有持续可用的性能提升”,如果今日至强5600的推出仅仅是为了延续而延续的话,这也便丧失了作为首款企业级32nm服务器处理器诞生的意义。

Tick-Tock战略,保证了英特尔能够稳定平滑,风险较低的不断更新服务器处理器,而不会对用户的采购造成过大困扰,实际上每一次较为重大的升级周期都是两年,也就是制程和架构全部改变。

在参加专访时,英特尔解决方案部中国大区技术部经理梁岩除了肯定了贺晓东的说法外,更详细的表示:“要有一款产品把制程技术推进一步,把密度做高,核做多,架构不变风险最小,这个过程对客户来说大家会感受价值没有架构变化那么大,但是对客户来说风险降低了。”梁岩说,“跟上一代比花同样的钱得到了更多的性能,加的东西可以看到。”无论对于用户来说,还是英特尔的研发团队来说,都很重要——变化小,自然可以把东西做的更结实,了解下一代制程技术、架构技术是否成熟和完整。

单从贺晓东和梁岩的话中,我们只能了解到为何从英特尔的角度,推出至强5600是必要和有益的,但对于用户来说,至强5500到至强5600的变化能有多大的获益?一年之后诞生的至强5600到底是不是有更大的提升能够足以让用户心动?

梁岩的一句话或许能够成为我们解释这一切疑问的钥匙,就是上面那句:“跟上一代比花同样的钱得到了更多的性能,加的东西可以看到。”——首先,我们要知道的是,到底梁岩所说的“加的东西”到底在哪里。

 

从至强5500到至强5600:非跨越但精彩

正如我在之前的文章里所提到的,虽然至强5600是首款采用32nm制程工艺的企业级x86服务器处理器,但至强5600之余前辈至强5500,并非是一个新纪元的开始,最多只能算是一个合格的接班人而已??在至强5500中所采用的QPI技术彻底解决了原有x86处理器的I/O带宽问题,Nehalem微架构也由此成为一个新纪元的开始。如果说下一个纪元将会从何时开始,我想到会是明年的Sandy Bridge架构。

但是,对于至强5600所带来的大幅度性能提升和功耗下降,我仍然要说,“非跨越但精彩”,这就像2010年北京电视台的动画春节晚会,虽然还是一台“春晚”,但却有着非同凡响的精彩与创新。

至强5600最大的变化莫过于其最多六核心的设计,英特尔的工程师在相差无几面积下为至强5600多塞入了两个计算核心,但事实上,如果我们列出一些数据便能直观的看出至强5600的过人之处:

至强5500和至强5600规格对比

从基于至强5600的多项测试结果的提升中,我们也能够看得出至强5600的性能提升幅度之大??在贺晓东所展示的九项标准测试中,提升最少的SPECWeb2005和SPECfp rate base2006两项测试的性能提升都达到了25%,而提升最高的SPECjbb2005则提升了多大46%。

根据公开的测试结果,采用两个英特尔至强处理器X5680系列的思科UCSB250 M2服务器创造了一项新的虚拟化性能世界纪录:它在26个片状单元上的VMMark测试得分为35.83,比基于至强处理器5500系列的上一代系统的得分提高了42%。而基于至强5600系列的思科UCSB200 M2平台和思科UCS C250 M2平台还分别创下了SPEComp Mbase2001和SPECjAppServer2004 基准测试的全新世界纪录。

除此以外的另一项足以证明至强5600的精彩之处的“证据”来自于同门兄弟的“PK”:作为至强5500家族性能最高(当然功耗也最高)的至强X5570,其性能仅仅相当于至强5600家族封装功耗60瓦的低电压版至强L5640处理器,但是,我们仍然发现,L5640的功耗要比X5570低30%。

但是,仅仅是数据上的提升是不够的,正如接受采访的吉林大学计算机科学与技术学院副院长魏晓辉教授所说,标准的Linpack数值并不能显示出一款产品到底性能有多少,只有真实的应用才是事实??贺晓东的一个例子恰恰可以作为真实应用的事实来展示至强5600的巨大变化。

贺晓东引用英特尔至强5500的老用户中石油东方地球物理公司的物探技术研究中心副总工程师的一句话说:“在新的平台上,比老的5500平台性能提升了38%。”??性能提升38%意味着计算时间更短,效率更高,意味着总体能耗更少,性能更好。

而在另外一家用户世纪互联那里,至强5600新增加的AES-N指令以及提高的性能让技术副总裁蒋建平很是高兴,因为“在虚拟化性能上比基于至强处理器5500系列的平台实现了58%的提升,而其总体拥有成本则降低了21%。”他认为,这将是世纪互联云计算基础设施服务平台性能和扩大云计算服务规模的理想之选。

需要进一步指出的是,无论是东方物探还是世纪互联,都是英特尔至强5500的用户??他们抢先测试至强5600并获得优异结果的事实又将我们向寻找至强5600真正的出生原因迈进了一步。

用户需求推动一切:计算科学成为支柱学科

正如梁岩所说,花同样的钱得到更多的性能,是用户所关心的问题,但现在,用户不仅仅关心“花的钱”和“得到的性能”,还关心“不同应用下的性能”,关心“达到一定性能所带来的功耗”,关心“产品的升级换代”。企业用户正变得越来越聪明,尤其是对于能够直接同英特尔对话的用户来说。

这就是英特尔所面临的问题,如果至强5600所带来的仅仅是一把钥匙而不是一间藏满珍宝的房间的话,这把同样可能打开一间陋室的钥匙,就将变得一文不名,但恰恰就是这把看似来的有些仓促的钥匙,却打开了一个谁都无法想象的奇妙世界。

吉林大学的魏晓辉教授对于基于至强5600平台的服务器的绿色计算印象深刻,他笑称,虽然学校现在还没有向他所负责的高性能计算中心收电费,但是如果一旦要计算入电费开销,那将是自己那点资金无法支撑的,毕竟只有200万元建立高性能计算中心机房建设的魏晓辉教授的每一分钱都是分外珍贵的。

因此,对于吉大的高性能计算中心,甚至对于大多数院校的超算中心而言,是否能够省钱,能够创造最大的性能,是一个迫切的危及到生存的问题,魏晓辉说,电费的问题“以后早晚要考虑”,所以,将就低碳经济和绿色计算是很有必要的。

在魏晓辉看来,最直观的例子就是学院自己做的一次测试,同样的VASP程序,在至强5500上算完耗时3300多秒,而在至强5600上则仅有2700多秒,而由于这两款处理器的功耗几乎相同,魏晓辉说:“这就相当于缩短时间,功耗就降低了。绿色计算指的就是这个,完成同样一件事情减少了功耗的开销。”

魏晓辉说,VASP程序还只是一个普通的保守的例子,“其他的例子会比这个更好。”

而在魏晓辉背后,另一股暖流正在不断推动着他和他的高性能计算中心。

据魏晓辉介绍,自国家针对211工程院校展开题为“千人计划”的引进国际高层次学术人才的规划之后,在吉林大学几乎没有例外的“每一位“千人计划”引进来的人都要求工作条件中具备高性能计算。”但遭遇的问题却也十分尴尬“学校的状况计算资源严重不足,不是没有,但是没有一个相当规模的学校的计算中心。”虽然每个院系都有自己的中心,但是仍然严重不足。

“比如说超应用材料国家重点实验室,它的老师需要到上海租用额外的资源,长春和上海比较远,沟通有一些不方便,从服务商来说有的时候达到不了用户的要求。电子学院的老师有时候说,自己买PC机,用低速的网络自己搭建一个比较粗糙的集群进行科研。材料学院、地学、汽车学院等等都需要这些资源,但是目前没有平台。”作为主管计算机科学与技术学院的副院长,从魏晓辉的嘴里听到如此的现状不免有些尴尬。

魏晓辉坦诚:“高性能计算平台已经成为学校学科发展的迫切需求,从计算科学到现在,与以前的理论科学和实验科学相比已经成为科学上的一个“金三角”,缺一不可。高性能计算平台也是科研必备条件,如果没有这样的平台对学校以后学科发展是一个严重的制约。”

于是,吉林大学才会投入1300万元,“1100万元用于购买计算资源,200万元进行机房建设。”

但,在魏晓辉在2009年底最终选择至强5600进行测试的时候,至强5500正是处在技术应用和产品、价格成熟度最好的时候,一向寻求稳定且资金并不充裕的学校用户,为何去追新呢?魏晓辉一方面笑称“要买不能买落后的,要买新的”,一面也道出了实情。

选择至强5600:你的想法是否与他相同?

在回答记者关于是否有服务器供应商提供英特尔的竞争对手的产品时,魏晓辉以学术人独有的坦诚说他“也考虑了一下”??他表示,因为产品发布对用户来说没有倾向性,吉林大学提的只是性能指标,至于厂家用什么样的产品做推荐,吉林大学也是根据厂家的反馈综合考虑,招标书上“都可以有,是公平的选择。”

目前英特尔推出的至强5600的各个产品型号

当然,最终的胜出者显而易见??魏晓辉说:“经过对比我们做了一个选择,还是要选择5600。”他表示,这基于如下几点考虑:

1、 花钱买东西,花同样的钱买更好的计算能力肯定划算。

2、 中心建完之后很多的成本是来自电费,我们买了更多计算能力的同时没有带来更多的运营成本的增加,这也是划算的事情。

3、 新的产品、新的芯片,没有用户做过测试,但是由于它是体系结构没有变化,是一个平滑过度,相对来说这个技术风险比较低,也是我们可以承担的。

4、 在管脚方面,至强5500和至强5600系列一样,供应商主板不需要变化,供货周期没有影响,对我们学校来说建设周期时间也没有太大的风险。

就在魏晓辉作介绍之前,英特尔(中国)有限公司资深技术市场工程师罗一峰在现场做了一个演示:不到十分钟,罗一峰将一颗至强5600处理器插在了原本运行workload需要9.06秒的一台至强5500服务器上,计算时间随即下降到6.13秒。

从四核到六核,从45nm到32nm,从50%的性能提升到相同的功耗,从至强5500到至强5600,这其中,大有文章。