AMD本月底将预热“Bulldozer”处理器

尽管AMD要到明年才发布"Bulldozer"PC和服务器处理器,但是AMD将在月底在美国斯坦福大学召开的Hot Chip大会上公布这款处理器。

毕竟,IT市场总是向前看的,AMD必须一直谈论未来计划,让OEM合作伙伴、企业客户和消费者对此感兴趣。

AMD从去年11月就开始谈Bulldozer和Bobcat,并在接下来的12月谈到了Bulldozer核心的模块化设计,以及首次透露了"Interlagos"和"Valencia"皓龙处理器计划。

即将在8月22日~24日召开的Hot Chips大会上,毫无疑问AMD将提供更多关于这些芯片的细节,而这些芯片也将为未来几年AMD微处理器业务打下基础。

AMD总裁兼首席执行官Dirk Meyer上个月在公布财报结果的时候表示,首个Bulldozer设计已经在第二季度完成,样品将在2010年下半年交给OEM客户,并将在2011年投产。

然而有些遗憾的是,"Llano"Fusion芯片将与四核Phenom II芯片一起被集成到经过修改的HD5000系列GPU–AMD称之为Acceleration Processing Unit(APU)–中,并将在2011年上半年上市。Llano APU将采用来自AMD皓龙代工伙伴GlobalFoundries的32nm制程工艺。

这是服务器和工作站买家唯一感兴趣的,因为"Interlagos"G34插槽和"Valencia"C32插槽也将采用 GlobalFoundries的32nm技术。目前,32nm技术的产量并不如AMD和GlobalFoundries之前预测的那么高。这可能意味着Bulldozer系统的上市会有所推迟,但是考虑到AMD已经为自己制定了12个月的目前,因此很难说Interlagos和Valencia芯片是否会推迟。

对AMD来说有一个好消息,那就是"Ontario"APU(由一个Bobcat和一个片上GPU组成)将在第四季度上市;基于Ontario芯片的产品将在明年开始出货。Ontario APU由TSMC采用40nm技术制造。TMSC目前并不生产皓龙芯片,但生产AMD图形处理器–如果GlobalFoundries还存在问题的话,TMSC可能会至少得到部分生产皓龙的任务。

此事关系重大,如果GlobalFoundries不接手这个32nm的生产任务,AMD可能会遭受推迟的影响。但是AMD对自己的前芯片工厂十分自信,并且已经开始公布关于未来基于Bulldozer的芯片的性能数据。

AMD服务器/工作站产品营销总监John Fruehe在自己的博客中写道:"我们将在发布的时候公布基准测试结果,因此不要期望很快有太多细节透露。从性能角度来看,如果你将我们的16核 Interlagos与12核皓龙6100系列处理器(代号Magny-Cours)进行对比,我们估计用户将看到内核数增加33%使得性能提高50%。这意味着,我们期望每个核心的性能是符合正确的方向–这就是在发布之前我能说的全部。"

在过去几代皓龙处理器中,AMD利用整个核心–处理单元、内存控制器和缓存等–并尽可能地像一个模片上集成更多核心:2个、4个、然后是6 个。对于Magny-Cours芯片来说,45nm处理器并不允许AMD在一个模片上做一个12核的处理器,因此AMD利用2个6核芯片,做到一个封装内,共享一个G34插槽。

Bulldozer芯片的基本构建块是AMD所谓的"模块",带有一个有自己L1缓存的单线程四通道的整数单元。这个模块中2个这样的整数单元,以及2个 128位浮点计算单元;所有4个这单元共享指令集和解码单元,以及共享的L2缓存、共享的L3缓存和共享的北桥来连接到外围设备。这样2个Bulldozer就有一个共享的浮点调度器和两个整数调度器;如果整数单元空闲的话,这个四核芯片就可以在一个时钟频率内执行4个双精度或者8个单精度读点运算。

用于单路和2路设备的Valencia皓龙芯片(也就是之前的皓龙4200)模片上将集成4个这样的模块,带有一个共享L3缓存,以及一个集成内存控制器和集成北桥。Valencia芯片预计出货时激活6个或者8个核心。据推测,Interlagos芯片是将2个这样的模块集成到一个模片上。 Interlagos预计将采用12核或者16核,用于2路和四路系统。

AMD表示,Bulldozer的共享组件策略最终使得Bulldozer的性能是目前2个Magny-Cours核心的1.8倍。

如果AMD不做任何改变,只是将2个6核的设计变成1个16核,单是这样就会使性能提高33.3%。但是共享组件的1.8倍调整意味着核心数能让你在每个时钟周期内获得20%的性能提升。因此其他30%是来自于核心变动和主频的提高。

笔者的猜测是,Interlagos的主频将达到2.75GHz,特别版的Interlagos可能主频更高。这要比AMD 12核皓龙6100的2.2GHz更高。

主频2.75GHz也更加接近面向2路系统的至强5600的2.93GHz,略高于面向2路、4路和8路的至强7500。