DoSERV分析 11月22日国际报道:新的"10h"架构为已经推出的Phenom和"巴塞罗那"四核芯片增强处理能力,随着其面市,AMD在这场处理器争霸战中向Intel发起猛攻。
为了真正理解这场四核竞争的态势,用户必须通过哪种架构更好这一争议来认清这场角逐。显然Intel在首场得分中领先于AMD。Intel已经推出多款四核台式机处理器,作为其双核Quad与双核Extreme系列产品的一部分。在服务器方面,目前Intel已经推出了不下于9款四核Xeon服务器芯片。
在5月3日的春季分析师大会上,Intel详细介绍了公司近期的其他计划。这家芯片巨头计划推出的产品包括两款基于Intel最新的45纳米芯片技术的四核处理器:用于台式机的Yorkfield和用于服务器的Harpertown。
AMD在推出四核芯片的竞争中稍有落后,他们试图将争议的焦点转移到哪家公司制造的处理器更好这一问题上。Phenom是刚刚宣布的台式机四核芯片的名称,之前的名称是Agena,而"巴塞罗那"是Opteron服务器芯片四核版本,AMD认为这两款产品胜过Intel的产品。
Phenom 将成为AMD的Agena台式机四核芯片的正式产品名称
尽管,或者可能由于,Intel首先推出四核芯片这一事实,AMD毫不迟疑地指出其最初的四核处理器是全新的整体设计。AMD的FX产品经理在一次电话采访中说,"目前世界上没有哪家制造商拥有原生的四核芯片。我们的竞争对手只是将两个双核芯片叠加。"
这一讽刺源于这样的事实,Intel的第一代四核芯片实质上是将两个双核处理器并行安装。但Intel并不认为这有问题。正如Intel的首席执行官Paul Otellini在去年9月的Intel开发商论坛上所说的,"最初的产品是多芯片,但那又怎么样?如果你认为用户会在意芯片的内部构造,那你就误解这个市场了。"
根据以往的历史判断,PC用户对处理器性能的关心要远远超过设计问题,而对于非电子工程师,深入理解这些问题非常困难。事实上,当2005年双核处理器开始引起争议时,一场关于谁的技术略胜一筹的销售大战就开始了。接着,AMD就宣称,与那些用螺拴固定起来的800系列奔腾Ds相比,其Athlon64 X2处理器才是"真正的"双核处理器,
四核Opteron "巴塞罗那"芯片图
然而,双核决斗又成为一场处理器性能之争。大多数用户认为AMD已经率先胜出。而Intel则被认为,在2006年中期推出其双核Duo系列芯片后,才恢复其优势地位。
四核芯片就绪
当Phenom和"巴塞罗那"推出时,AMD希望所采用的新10h架构有助于让某些性能有飞跃式的提高。该设计结合了一系列增强功能,包括:新的指令、增强型浮点执行单元、浮点寄存器与通用寄存器之间更快的数据传输能力、以及1Gb的页面存储等等。10h架构还结合了最优化性能,让AMD基于硬件的虚拟化产品运行速度更快。
除了集成到芯片本身的运算功能之外,AMD的大多数优势明显地体现在它对I/O到外围设备以及处理器之间的通信的处理方式上。与这种通过一根前端总线发送输出数据的传统方法相比,AMD早就开始采用其专有的HyperTransfer接口了。随着10h架构、HyperTransport3技术的出现,下一代升级产品将链路的总带宽提高到20.8Gbps。
此模块图标识出AMD 四核Opteron "巴塞罗那"芯片的不同功能单元
在今年2月的国际固态电路大会上,当AMD讨论其四核Opteron时,曾经透露这种处理器含有4.5亿个晶体管,并以65纳米CMOS技术制成。这让AMD在某种程度上略逊于Intel,后者将于今年晚些时候推出45纳米四核处理器。就芯片结构而言,体积越小越好,因为这样它能以更低的功耗运行。通过将更多的处理器集成在每个直径为300毫米的晶圆片上,在晶圆片上对芯片进行制造然后进行切割并独立封装,从而芯片供应商可制成更多的产品。
Intel公司一直以来都以其极小的芯片规格在芯片制造方面占有极大的优势。公司目前的想法是要在45纳米技术方面远远领先于AMD。Intel宣称,公司正在对4家工厂进行改建,增加制造45纳米芯片生产线。然而,AMD也在着手准备投产45纳米芯片,并且据说已在德国德累斯顿的工厂Fab 36制成原型晶圆片。
就片上功能而言,"巴塞罗那"的四个内核每个都各自拥有512-kB L2 高速缓存,并共享一个2-MB L3高速缓存。该处理器将支持快速的DDR2/DDR3存储器。
有趣地是,四核竞赛在某种意义上也是一场八核竞赛。AMD一直强调Phenom可以支持双插槽主板。这让两个各有4个处理器的芯片可以安装在同一系统中,因而总共有8个内核。"巴塞罗那"将允许类似的多插槽配置(包括特别高端的四插槽NUMA设计), 正如Intel的产品。
在多处理器配置中采用四个"巴塞罗那"
深入考察AMD已集成到新型10h架构中的一系列不可思议的技术改进,这些技术将与Phenom和"巴塞罗那"一起面世,下列是改进的方面:
- 加强浮点支持。早期的处理器具有64位浮点执行单元。采用10h架构,AMD将可以为Phenom和"巴塞罗那"配置128位浮点单元。位数更多的设计将让浮点矢量运算的性能提高一倍。
- 提高取指令能力。取指令窗口已从16字节扩展到32字节。这让处理器在每个周期中能处理一个完整序列的三个大型指令。
- 大页面支持。如早些时候所提到的,目前的10h架构处理器可以支持1GB分页。这种功能为象多媒体这样的处理大数据集的应用程序带来了很大优势。
- 指令集改进。包括对运行在通用寄存器上的两种高级位操作指令的补充。
- 虚拟机最优化。10h架构包括很多方面的改进,用于提高AMD虚拟化技术以及优化编译器。