AMD此刻正面临着财务亏损的窘境,但是他们对即将在今年底推出的"Bulldozer"皓龙处器持乐观态度,他们对"Bulldozer"能满足用户需求并从竞争对手英特尔手中夺取服务器市场份额实现盈利充满了信心。
AMD企业级和公共业务事业部总监Vlad Rozanovich在接受采访时介绍说,第一款Bulldozer皓龙芯片家族的16核"Interlagos"处理器目前在第二季度还处在生产阶段,预计正式推出的时间会是在第三季度的某个时候。这些处理器预计将应用于双路或者四路服务器,还将插入现有的使用G34插槽和目前搭载12核"Magny-Cours"皓龙处理器6100系列的服务器。
在Interlagos处理器推出之后的某个时间段里,AMD将发布面向使用C32插槽服务器的八核"Valencia"处理器,这种服务器目前搭载的是六核皓龙4100处理器。C32服务器的设计主要是针对轻量级,低能耗的超大规模工作负载,可以用于不同类型的单路或者双路服务器。Interlagos和Valencia处理器是由GlobalFoundries负责生产制造,在AMD之前的德累斯顿工厂中使用32纳米制程工艺完成。
英特尔当然不会对AMD即将推出的32纳米处理器坐视不理。作为IT行业的芯片巨头,英特尔已经透露了有关其至强E3-1200处理器的部分细节,这款处理器是基于"Sandy Bridge"的设计,是其针对单路微处理器的出其不意的战略组成部分。英特尔预计很快就会将基于之前"Westmere-EX"设计的高端至强E7处理器推向市场,预计的推出时间为本周。
这也让英特尔掉足了整个市场的胃口,直到他们针对双路服务器的至强E5处理器推向市场,这款处理器预计会在今年的第三季度推出,这个时间与AMD的首款Bulldozer皓龙处理器的亮相时间不谋而合。
在至强E5系列处理器和AMD皓龙6200系列处理器(如果AMD确实是这样命名的话)在一般用途的双路服务器市场上正面交锋之前还有很长的时间和大量的市场营销工作需要完成。
AMD认为他们在X64处理器之争中将占据优势,他们认为其处理器将比目前或者未来的至强处理器更加适用于超出多数用户预期的更加繁复的工作负载。有些工作负载是你可以预计到的,比如在公有云或者私有云上运行虚拟服务器实例,有些工作负载是你可能无法预计的,比如金融机构进行的蒙特卡洛模拟。
AMD这些年来一直在为其处理器造势,随着Bulldozer处理器的推出时间越来越近,营销攻势也越来越声势浩大,AMD宣称英特尔公司为其至强处理器每个核心创建两个虚拟软件现成的超线程技术并不像让两个真实核心承担工作负载那样出色。AMD公司认为Bulldozer体系架构的核心设计(即将这些核心中两个有着共享基础的核心放在模组中,然后在单个芯片上放置多个模组)比英特尔的超线程模式要更加出色,英特尔公司的做法是在封装中放置的核心数量比AMD的要少,但是增加了超线程并使用环形架构将核心连接在一起(Bulldozer的设计方法和英特尔Sandy Bridge及Westmere-EX的设计方法详细信息见其他文献)。
AMD言之凿凿的称用于G34服务器的主频为3.5GHz的16核处理器和用于C32服务器的八核处理器要比基于Westmere-EX处理器的10个超线程核心或者基于Sandy Bridge-EP处理器的八个超线程核心要更好。英特尔公司没有谈到Sandy Bridge-EP(至强E5处理器)或者Westmere-EX(至强E7)处理器的时钟频率,但是AMD公司从某些方面来说,有着时钟频率和核心数量的优势。
这是AMD所作出的一个有趣的赌注,如果事实证明MAD可以交付更多的核心,同时以更好或者同等的热量和性能来实现同等的时钟频率,并且价格也更加低廉的话,那么AMD的董事会会对今年1月解雇德克.梅勒感到困惑吧。
五大巨头
排名前五位的顶尖服务器制造商去年没有一家推出了搭载皓龙4100和6100处理器的服务器,但是惠普和戴尔公司都像服务器后起之秀宏基电脑公司那样拓宽了他们的业务范围,所有这些厂家今年都将服务器所搭载的处理器提高到了Bulldozer的级别。IBM公司推出的单机四路服务器在2U的机箱里容纳了所有的核心和大量的内存,但是没有在其他的服务器机型上采用这种做法,比如机架服务器,塔式服务器,刀片服务器或者碟式服务器。甲骨文公司在2010年1月收购了服务器制造商SUN微系统公司后便停止了制造皓龙服务器。
Rozanovich对记者说,从专用服务器主机向公有云基础架构转移将收到AMD的欢迎,因为这样将提高服务器虚拟化在全世界数据中心内部的应用比例。Rozanovich解释说“三年前当企业用户把他们的工作负载外包出去时,他们希望是一台真实的物理服务器。
而如今随着服务器的虚拟化比例不断攀升,用户不在真正关心他们是否拥有一台专用的服务器。他们关心的是实实在在的服务水平协议和他们工作负载扩展和缔约以及成本控制的能力”。主机需要创建更加标准化的基础架构,来帮助他们实现他们无法从专用服务器主机中获得的效率(所有那些未经使用的时钟循环,硬盘转速和没有数据的内存芯片都在浪费金钱,这让首席财务官们为此牢骚满腹)。如果AMD的皓龙6100系列处理器在特定服务器主机和高性能计算领域取得成功是一种征兆的话,那么AMD公司认为这对于其在服务器领域的重新复苏是非常好的迹象。以服务器虚拟化为例。据Rozanovich介绍,在云提供商方面,他们的虚拟化系统目前的中央处理器利用率大概为80%到90%,比运行单一工作负载的X64服务器5%到20%的利用率要高的多。“当你的中央处理器以这种高利用率运行时,超线程就没有用处了”Rozanovich表示“系统没有时间或者容量来运行超线程。因此目前,运行常规虚拟服务器工作负载的用户关闭了他们至强服务器的超线程功能,就像超级计算机多年来所做的那样”。
对于虚拟服务器来说,在皓龙处理器上放置比同等至强处理器更多的核心让AMD公司拥有了一个轻微的优势,因为企业用户会尝试将虚拟机与核心联系在一起,而不是与线程联系在一起。因此如果AMD的服务器合作伙伴在2U机箱内放置48个皓龙6100核心,而英特尔的至强7500系列处理器集成的是32个核心,而两者都拥有大量的内存,那么相比较而言AMD就胜出了(当然,去年AMD公司在内存容量之争中败下阵来,这是因为其皓龙6100内存控制器的最高内存容量为512GB,而英特尔公司的至强7500处理器的内存达到了1TB或者2TB。Interlagos皓龙处理器拥有重新设计的DDR3内存控制器,能让主存容量达到千兆级)。
软件的重新设计来利用更多的核心和线程还对AMD公司,英特尔和其他处理器的供应商是有所帮助的。为了阐明AMD的核心设计强大的核心体系是如何的强大,Rozanovich采用了金融机构使用的蒙特卡洛模拟来评估他们的股票和债券,帮助他们随着市场的变动来完成交易流程。Rozanovich表示“蒙地卡罗模拟的古老法则是最快的频率和最低的延迟总是战无不胜。因此在2005年和2006年,AMD赢得了蒙特卡洛交易中的大部分”。特别是当能耗被计入方程式中时,数据中心通常要应付耗能在25000瓦或者30000瓦的超密度服务器,华尔街,伦敦金融中心和其他金融中心附近的数据中心通常只能为每机架供应9000瓦。因此每瓦和每时钟都要计算在内。
但是随着"Nehalem-EP"至强5500系列处理器在2009年3月推出时,AMD丧失了时钟频率和延迟的优势,这主要归功于英特尔公司低能耗的Nehalem核心和用来连接主存和外围设备及核心的QuickPath互联架构。但是金融机构必须对他们的模拟平台每隔18个月到24个月进行更新换代,所以AMD公司开始造势他们的12核Magny-Cours处理器来吸引蒙地卡罗模拟用户的青睐,目前这项业务正在构建当中。“Magny-Cours处理器被用户所接受不是在一时半会所能看到的”Rozanovich表示。
Rozanovich认为部分原因是金融机构的编程人员需要学习如何实现并行编程。“一些运行蒙地卡罗模拟的金融机构目前使用低速12核Magny-Cours处理器获得了比高速八核处理器版本要好得多的性能”。Rozanovich告诉El Reg说“随着研发人员逐渐熟悉了并行计算的编程方法,他们会针对这些核心开始编程的”。
在那些对能耗预算有着严格要求的金融机构,能耗是被英特尔和AMD所设计的处理器所操纵的,Rozanovich表示。一些大型银行,股票经纪和对冲基金会将能耗预算考虑在内,他们会坐在一起探讨并判断他们在未来的处理器使用中要以什么时钟频率使用多少数量的核心。这不是非常定制的硅晶片,但是两家芯片制造商都必须为高速交易系统,蒙地卡罗模拟和其他模拟交易提供超频。