或许是因为春节的关系,POWER7的发布要比别的国家“来的要晚一些”,时隔三年,有关POWER7的各种细节的披露已经证明业界的等待是完全值得的,无论是对于IBM还是UNIX服务器的广大用户,POWER7的出现不仅仅是一个处理器家族的延续,更是一种计算模式和应用习惯得以延续的保证。
不过,IBM并不将这一次的发布像之前的六次一样,定性为一个“处理器的推出”,这一次,更加明确的概念是Power服务器,是Power 750、755、770和780这四款从经济到高端的“小型机”,或者,我们可以称其为“关键业务服务器”——当然,他们仍然是AIX的家,是“UNIX关键业务服务器”。
而在POWER7海外发布的同时,曾经誓言挑战RISC处理器市场,改变小型机市场格局的一个“后来者”也发布了其最新的处理器——很明显,它就是英特尔安腾9300,曾用名是Tukwila,英特尔在博客中写道:“Tukwila性能是上一代产品的两倍多,增加了一系列可扩展性、可靠性和虚拟化功能。”
当UltraSPARC架构飘忽不定,富士通独自“坚守”SPARC64的今天,POWER7和Tukwila成为了这个市场上仅有的两个竞争对手——十年前的竞争对手PA-RISC和Alpha早以逝去多年,谁能想到,如今的RISC之争,却成为了一个老牌RISC处理器和外来挑战者的游戏?
POWER7和Tukwila:相同与不同
既然是稳坐头把交椅和挑战第一的关系,POWER7和Tukwila在研发需求上必然会趋向一致,作为都是面向UNIX服务器市场,针对关键业务应用的服务器,这两者在很多地方的相同之处体现着两个业界最强大的处理器厂商对技术和应用发展趋势的一种共同认可。
首先,在POWER7和Tukwila中,二者都带有明确的提升频率的技术,安腾采用的是在至强已经成熟的类似“超频”的Intel Turbo Boost技术,在四核心Tukwila上,通过Turbo Boost可以提升7.5~9.8%的时钟频率。而在POWER7上,类似技术被称为“TurboCore”,通过这项技术,IBM通过关闭八核心POWER7中的一般内核,将原有的3.84GHz频率提升到4.14GHz,而相对应的是每个核所分配的缓存数量则提升了一倍,达到四个核心共享32MB L3缓存。
POWER7拥有更大的L3 Cache,每个核心独享4M,而在TurboCore和MaxCore不同模式的切换下,每个核心最多能够分到8M。
值得注意的是,POWER7和Tukwila都并不在所有型号中提供这样的功能,Tukwila中,双核心的9310并不支持Turbo Boost技术,并且每个核心的三级缓存被削减到5MB。POWER7则根据服务器的型号来确定是否TurboCore功能——只有最高端的Power780才有。
IBM对于为何需要关闭一般内核才能提升频率的解释是,“能耗和工艺都是需要考虑的问题,”在春节前的一次沟通会上,IBM系统与科技部大中华区Power Systems资深架构师李永辉表示,主要的原因是因为“提升频率之后,处理器的温度会上升很快,频率的提升和温度/功耗的上升不是正比(他当时基本接受了媒体记者“甚至是呈指数增长”的说法)”。
而对于英特尔来说,我们所做的只能是猜测:高端型号频率提升后对性能的提升会更明显,而根据英特尔一贯的处理器制造工艺和优/良品管理经验,双核心版本能否支撑得住频率提升后的功耗、散热大幅度提升所带来的问题需要获得进一步的证实。
DDR3是这二者的另一个共同点,无论是POWER7还是Tukwila,都将支持DDR3,而这两者在宣传时,支持更大容量内存以及内存通道带宽、内存控制器方面的优势都是共同的重点,从这一点上来看,内存容量、带宽、内存控制器仍然会是UNIX服务器的一个热门话题。更是用户关心的重要方面。
毫无悬念的,IBM抛弃了DDR2——它对于新的POWER7来说已经显得太慢了,工程师们为POWER7设计了最多两个DDR3内存控制器,而每个控制器带有4条内存通道,每个通道的速度为6.4Gbps,最大可以访问32GB(使用两根16GB内存条)。这样一来,每颗POWER7处理器最大可以访问256GB。
在高端的Power780上,每个POWER7处理器卡上有两颗处理器,每颗处理器中有两个内存控制器,每个内存控制器对应4条内存通道,但每个通道只对应一个DIMM,因此每块卡上共有16个DIMM。IBM甚至还通过一项名为“Active Memory Expansion”的技术,完善了内存虚拟化,为软件“欺骗”出多一倍的内存。
DDR3对于全新的Tukwila来说同样重要,甚至曾经有传闻称,正是因为对DDR3支持的问题才导致了Tukwila的第一次推迟发布,不过这并不重要,重要的是,Tukwila通过英特尔集成内存控制器的点对点连接架构,也就是常说的QPI,其系统互连带宽超过了上一代安腾9100的8倍,Tukwila拥有的两个内置的内存控制器(IMC),每个内存控制器可以操作两个高速内存通道,而每个内存通道(每个通道支持4根内存)将连接到一个内存缓冲器上,从资料上来看,Tukwila已经支持了最高单条16GB内存
内存带宽猛增5倍,并通过支持16GB DDR3内存,Tukwila可支持的内存容量增加了7倍(四插槽新安腾服务器可以支持1TB DDR3内存)——英特尔安腾首席架构师Eric Delano曾经出人意料的表示,Tukwila的设计出发点是“每个内存控制器最大可以支持1TB内存。”可惜我们没有在Tukwila上看到这一革命性的设计。
需要指出的是,在面对POWER7服务器强大的多路竞争压力下,英特尔已经将原本八路、十六路甚至六十四路服务器的构建能力通过整合节点控制器技术传播给了那些处于业界中游的服务器厂商,Tukwila甚至不通过节点控制器,就可以轻易搭建8路系统,而通过第三方节点控制器,则可以扩展到64路系统——与Nehalem-EX所拥有的节点控制器一样,不具备八路、十六路等多路服务器设计能力的企业将获得一个天大的馅饼。
在制程工艺方面,英特尔为新安腾选择的仍然是65nm,而IBM则抢先一步进入了45nm,不过,英特尔的如意算盘在下一代的Poulson上,因为它将是32nm的——英特尔跳过了45nm。在功耗、节能方面,IBM和英特尔的目标同样是一致的,更低功耗,更智能的节能管理,这些都成为了双方必须要争夺的概念市场。显然这些也都是目前关键业务服务器用户最关心的问题。
有关RAS安全性方面的内容,目前由于还没有进一步有关Tukwila正式发布后的详细情况,只能够以之前发布的情况作为参照(2008年上海IDF上的资料)
2008年上海IDF时,英特尔安腾首席架构师Eric Delano曾经谈到过有关Tukwila安全性方面的内容,Eric表示,新的Tukwila已经在L2和Directory缓存中引入了英特尔专有的缓存安全技术,并通过soft-error硬件电路增强软件错误的保护,与此同时,英特尔也考虑到了内存RAS特性,他介绍说除了ECC保护之外,英特尔提供了内存通道保护,当出现硬件错误时内存会通过CRC以及Lane Failover来纠正,并在通道重置时完成lane failover操作(据Eric表示,内存控制器在试图重置通道物理层之前会重试多次。)
Eric在演讲最后提到了QuickPath Interconnect RAS,他表示,基于QPI的全新安腾处理器了从物理层、链路层以及协议层多方面上进行了对于错误情况的系统保护。
POWER7方面,RAS安全性同样是关注的重点,其中IBM尤其重点宣传了L3 eDRAM缓存的重要性,详细的部分相关媒体已经有所报道,在此不再赘述.
RAS特性在POWER7上表现的淋漓尽致,值得关注的是针对虚拟化的RAS特性,IBM的PowerVM虚拟化管理器拥有全DIMM失效保护
安腾:挑战POWER至少再等两年
三年以前的2007年,是安腾的“大年”,那一年也是安腾联盟最忙的一年,无论是当时的联盟主席吴定严还是后来的接任者SGI的吴玲玲,在安腾这面大旗下,许多的人都在埋头苦干,这其中不仅有英特尔、合作伙伴和ISV,还包括一干媒体记者和公关公司。
2007年7月17日,安腾世界大会在北京召开,安腾联盟,这个联系英特尔与诸多安腾合作伙伴的机构,承担了一项现在来看才发现几乎是不可能完成的任务:打造一个安腾解决方案联盟,启动并执行一整套开发商支持计划,包括开发商日(Developer Days)、解决方案中心(Solutions Center Network)和解决方案目录(Solutions Catalog),并以此为基础,加快软件开发商移植现有应用程序。
也是在2007年,承袭此前一年9月份英特尔宣布“白牌”安腾的政策,中国服务器厂商跃跃欲试打算涉水关键业务服务器市场,第一个吃螃蟹的厂商,自然是英特尔的“铁磁”宝德。
吴定严当时告诉记者,安腾的收入已经达到了Power收入的54%,这对于一个从无到有的服务器平台来说,绝对是一个伟大的成绩——只是这个成绩到如今却几乎成了原地踏步。
当时,一片光明前景的安腾给人的感觉是追上POWER指日可待,甚至有人给出了“五年”这一期限,而从今天的发展情况来看,安腾确实至少需要两年的时间——等待Poulson和Kittson,等待下两代安腾。
Tukwila晶圆
在处理器自身的特性上,最明显的就是频率,虽然POWER7从POWER6+的5GHz高主频调整到了目前的最高4.14GHz,但仍然超过安腾最高1.86GHz的两倍还要多,这对于追求单系统性能的UNIX服务器用户来说,很可能成为安腾最大的一个软肋。此外,与Power7不同,Tukwila核心的Itanium处理器采用了顺序执行架构,这使得其运行效率要低于Power7。
在缓存的设置上,Tukwila安腾与Power7也有不同,虽然都采用了三级缓存的设计,不过Tukwila的三个级别缓存都是采用的单核心独占的方式,每一个核心拥有16K的一级指令缓存和16K的一级数据缓存、512K的二级指令缓存和512K的二级数据缓存、另外还有6M的三级缓存,总的片上缓存在30M左右。
POWER7的缓存数量超过Tukwila,且得益于IBM所中意的eDRAM,POWER7陕西爱你了大容量的片上L3缓存——POWER7的八核版本拥有每核256KB L2缓存和32MB共享片上L3缓存(每核心4M,可调配给某个核心独占),四核版本技术核心数量只有四个,也拥有16M的L3缓存,而在高端的Powe780中,TurboCore模式允许四个核心共享32M L3缓存。
值得一提的是IBM所青睐的eDRAM,在POWER7中,IBM将eDRAM三级缓存从POWER6的处理器板上移到了芯片内部,POWER7也就成为首个使用片内eDRAM三级缓存的处理器。
我们从其中不难看出Tukwila和POWER7的差距,而这些只是一些基本技术指标,更多处理器特性方面的内容还未有所涉及——但这也不能怪Tukwila,按照英特尔的计划,也就是2007年的计划,2009年或2010年发布的实际上应该是Poulson而不是Tukwila,经过不断的跳票,安腾的发布已经与原计划几乎相差了一代!
安腾9350的基本特性,Tukwila支持英特尔的两个重要虚拟化技术:VT-x和VT-d。
或者我们可以说,Tukwila的推出只是为了延续安腾的发展路线图,为合作伙伴尤其是惠普,为用户尤其是惠普动能服务器的用户提供一个延续的保证,保证他们不会因为POWER家族的巨大性能提升而倒换阵营(当然,即使是倒戈,在UNIX服务器上也不是什么容易的事情,只是时间隔的太长未必就不会发生了。)
一场IBM VS 惠普之战
POWER7来自于IBM这个服务器行业的领导者,而安腾,来自于英特尔这个处理器行业的第一,只是在IBM自产自销的时候,英特尔的安腾,只能依靠英特尔的OEM合作伙伴了,当然,尤其是惠普,尤其是惠普的动能服务器——已经占据97%的安腾服务器出货份额。
在这里有一个很有意思的小插曲,可以看出IBM之于POWER和惠普之于安腾的激烈竞争:
美国弗吉尼亚大学计算科学系的邮件通信归档的三封邮件引起了我的兴趣,这三封有关涉及到三个产品:HP Integrity BL870c i2(采用Tukwila的新惠普动能服务器)、IBM Power 755、IBM Power 750,他们都被送来进行性能测试的,日期分别是美国中部时间2010年2月8日、2月5日(IBM的两封邮件来自同一个人同一天)
如果说在X86市场上,至少还有戴尔的存在的话,在POWER和安腾的战场上,IBM与惠普几乎是1v1的“冤家”,虽然现在安腾拥有包括NEC、日立、超微、浪潮、宝德等厂商的支持,但无论是规模、销量还是技术实力,他们显然都难以成为安腾的依靠,而是否能够将戴尔拉进安腾的阵营则成为了一个有趣的问题。
在多年前戴尔意图进入关键业务服务器市场的时候,其对安腾感兴趣的程度甚至都不低于惠普——即使是安腾是惠普与英特尔的合作产物,戴尔也对此不闻不问,但可惜的是,戴尔此后在2005年放弃了安腾,一说是因为安腾不符合戴尔开放、标准的理念(当时安腾还未白牌);一说是因为英特尔过于偏向惠普的动能服务器;还有一种说法是戴尔认为自己更适合中低端服务业务——无论说法如何,戴尔的离去即使没有重创安腾,也在一定程度上影响了此后安腾合作伙伴的发展速度。
如今的戴尔会回来么?答案是否定的,在开放式架构、工业标准和方法论的道路上发展的戴尔,如今已经毫无理由回到安腾的阵营,尤其是很可能花费大量的精力和资金却只能获得很小的市场份额的情况下,除非出现“地震”,戴尔回归安腾的可能性肯定是0。
正是基于此,IBM与惠普在UNIX服务器市场的对决是全方面的,尤其是在Sun飘忽不定的今天,从POWER7与安腾Tukwila,到IBM AIX与惠普的HP-UX,双方在市场上几乎无视Sun和Unisys、富士通的存在,双方的上演的都是“我的眼里只有你”的故事。这一点在每一次有针对性的媒体发布和演讲资料中可见一斑——要不是因为Sun被收购,恐怕这两者都想不起来去蚕食Sun的低端UltraSPARC市场。