当IBM第一次透露其新一代处理器Power6的设计思路时,仅主频将达到4GHz~5GHz这一条,就引起了种种的猜测、怀疑。当然,还有期待。
与一年半以前推出的Sun UltraSPARC T1和去年冬天推出的Intel双核安腾Montecito相比,将与本月20号左右终于正式面向市场发布的Power6,给高端处理器产业未来的走向、趋势以及高端处理器的设计思想带来了种种复杂的猜想,使得这一局面迷雾重重。
多核一统江湖
单芯片多处理器(CMP)的处理器设计思路,似乎已经被业界认可为近几年唯一可行的微处理器设计方法,来有效应对性能提升带来的巨大的功耗挑战。
可以看到,无论是早就采纳了CMP思路的RISC处理器(主要是IBM的Power系列、Sun的UltraSPARC系列、HP的RA-RISC系列),还是近年来将多核炒得沸沸扬扬的x86处理器(主要是Intel的至强系列、AMD的皓龙系列),抑或是处理器产业的后来者如Intel的安腾和IBM的Cell,无一不是在往“更多核心”的方向走。
业界也似乎一致认可,下一代的处理器将沿着4核、8核、32核甚至几百个核的方向亦步亦趋走下去。
Sun的UltraSPARC T1最早印证了这种思路。
2005年11月份,UltraSPARC T1面市。每颗UltraSPARC T1处理器中包含8个处理器内核,每核有4个线程,这是全球第一款能够同时运行32个并行线程的低功率、低热的处理器。Sun还表示,拥有CoolThreads芯片多线程技术的UltraSPARC T1处理器具有极佳的环保特性的处理器,每个线程仅仅消耗2瓦功率,每一颗UltraSPARC T1处理器仅消耗功率70瓦。这个数字,在功耗问题引起全球重视的氛围中,显得格外令人振奋,且再次印证了单芯片多核心设计思路在微处理器设计上的巨大优势。
后来,在x86领域,Intel和AMD也开始摒弃沿袭了多年的“更高主频”思路,向多核转型。尤其是在Intel推出4核至强系列处理器后,在功耗降低和性能提升方面显示出了较双核处理器更明显的提升,使得“更多核心”的思路再度受到肯定。
之后不久,Intel也将多核心思路移植到处于尴尬处境的安腾平台上,在2006年7月推出了第一款双核安腾。虽然相比较传统的RISC处理器和x86处理器,安腾在多核路上落在了后面,但是向多核转型的思路却是再明确不过了。
IBM在正统的Power之外与索尼、东芝共同开发的另一款处理器Cell,也以1个主核、8个辅核的设计思路以及产品问世后出色的性能,印证了单芯片多核心的势不可挡。
一句话以蔽之,就是目前的微处理器设计中,多核心之所以能够“一统江湖”,代表业界不再单纯追求单个处理器或者单个处理器核心的计算主频,而是强调系统单元的整体计算吞吐量。
所有的游戏场里,都会有一两个与众不同、独树旗帜者。
在多核心几乎一统江湖的游戏场里,Power6就扯出了一面与众不同的大旗,引来猜疑无数??高达5GHz的主频,是惊世骇俗的大胆创新,还是迫于无奈的缓兵之计?
Power6的高主频谜局
单芯片多核心(CMP)思路的确很好。
然而,它并不万能。实际上,早在2005年就有微处理器技术方面的理论专家指出,“虽然在未来的两至三代CPU上,CMP能够减轻功率效率方面we难题,但是单凭CMP并不能解决功率效率方面的挑战。从长远趋势上来看,只有在基本线路和架构上创新才是解决这类问题的根本出路。”
IBM对于Power6的高主频设计,是否就是在基本线路和架构上创新的一种思路?让我们看看目前能够拿到的一些技术参数吧。
去年冬天,IBM公司的Brad McCredie博士在微处理器论坛上透露了Power6架构方面的细节??主频在4GHz~5GHz之间,采用65纳米绝缘硅(SOI)、10层金属层工艺制造。“与90纳米工艺相比,在同样的功率下,性能提高了30%,这主要是由于使用了应变硅技术。IBM的65纳米工艺提供了0.65微米的高性能SRAM单元和0.45微米的单元以提高密度。存储阵列单元使用了比逻辑元件更低的电压,以减少功耗。”McCredie博士说。
与前两代产品一样,Power6着重于系统架构的搭建。每个微处理器单元(MPU)作为2路单芯片多处理器(CMP)设计来实现,340平方毫米的芯片上集成了两个同步多线程处理器,每个核心都配有专用二级高速缓存。下图显示了Power5+和Power6架构的异同。
Power5+和Power6架构比较图
实际上,引起关注的不仅仅是Power6的高主频,应该看到IBM为此而进行的微架构调整。例如,Power6有极高带宽可提供给处理器,比Power5+增加了一倍。在5GHz主频下,每个MPU都有300GB/s的带宽。另外,Power6还有一个内存控制器和MCM内的结构线路,从而把I/O频率从CPU频率的三分之一提高到了二分之一。同时,每个内存控制器使用IBM的第三代同步内存接口连接到内存。与全缓冲DIMM一样,这些共存内存接口(SMI)芯片能够配置更大的内存空间、使用不同类型的内存。
McCredie博士表示,Power6的系统架构完全经过了重新设计,比前几代产品先进许多。 例如,Power6的一级数据高速缓存(L1D)增加了一倍,增至64KB; 联合并行处理架构也增加到了8路。因而, L1D时延增加到了4个周期,而POWER5及大多数其他高性能MPU却是3个周期。Power6还对缓存进行了技术革新。两个4MB大小的专用二级高速缓存之间,有一个快速输出缓冲器(cast-out buffer),便于两者之间快速通信。三级高速缓存也得到了改进。这些改进能够提高联合并行处理能力,对多线程执行极其有利,并且帮助IBM对Power6的同步多线程(SMT)实现了比前几代产品更大幅度的提升。
对于Power6,IBM更强调的是可靠性、可用性及可服务性(RAS)。例如最多可以将将一个Power6处理器划分为1024个分区,添加了内存分区和迁移功能,以缩短用于修复的系统停运时间等。
这些技术创新加在一起的结果,就是IBM对于市场的这句承诺:“Power6的性能可以比上一代产品提高两倍,而功耗几乎维持原来的水平。”
不管怎样,IBM对于看上去与“多核时代”格格不入的Power6充满了信心,对于业界的猜疑也不置可否,这就使得高端微处理器的未来走向显得更加迷雾重重。
迷雾重重
假如执意要走“高主频”道路的Power6的性能比Power5+提升两倍而功率维持不变,也许IBM在高端服务器市场的地位会得到进一步加强。然而,在“多核心”之路上已经尝到了甜头的Sun和Intel,似乎也是信心百倍。
明年,Sun采用大规模多线程技术的Rock处理器和英特尔备受期待的Tukwila(4核安腾)处理器将双双问世。Power6、Rock和Tukwila谁将更胜一筹?