AMD真四核Barcelona的创新之秘

      AMD的下一代Barcelona真四核技术已成为2007年IT业最引人注目的技术之一。的确,Barcelona不仅意味着AMD把x86架构从真双核引入到真四核,同时也以全新的微架构,为业界带来了更多值得期待的创新特性。但是,Barcelona的技术创新、产品特性、性能指标近来也有过不少报道,但似乎不够详细。以下,就让我们来研究一下真四核Barcelona的创新之秘。


      真四核 不能做2+2


      AMD皓龙(Opteron)最大的技术革新,在于摒弃了x86架构一贯追求更高主频的做法,而借鉴了RISC处理器的CMP设计思路,将对更高带宽的支持引入到x86架构中。同时通过独创的直连架构和超传输总线技术,将CPU直接连接到内存、I/O,同时消除了传统的前端总线瓶颈,降低内存访问的延迟。或者说,正由于架构创新上的前瞻性,AMD在做单核的时候就考虑到了未来多核发展趋势,因而在从单核到多核的过渡中比竞争对手显得更自然顺畅。这也是AMD始终强调自己的多核是“原生”的根源。


      推出两年后,双核处理器的设计已经比较成熟,显然实现四核处理器最简单的办法就是做加法:2+2,将两个双核处理器集成到一个封装上就可以直接实现四核处理器,在这种实现方法中两个双核处理器几乎是独立运行甚少均衡负载的,在系统请求送达的时候CPU只需要简单的安排向左走还是向右走即可。但显然,这样的四核架构并不能令四个核心达到最高运行效率和负载均衡。


      AMD计划年中推出的Barcelona四核设计,仍然采用CMP(单芯片多核心处理器)设计思路,不用2+2,而是采用1+1+1+1来实现四核:每个核心具备自己单独的64KB的L1数据Cache、512KB的L2 Cache,然后四个核心共享2MB(或者更大)的L3 Cache。


      从晶体管数目上看,四核Barcelona核心包含4.63亿个晶体管,而双核Brisbane核心只有1.54亿个晶体管,2MB的L3缓存大约会占用1亿左右的晶体管数目。简单计算就可以知道Barcelona比两个Brisbane核心加2MB的L3缓存还多出5500万个晶体管。由此也可以看出,AMD的四核架构绝不是简单叠加,在CMP架构中非常重要的仲裁/分配、I/O控制等部分都经过了强化设计。


      当然,采用简单的2+2模式来设计多核处理器,这是缩短产品研发周期的好办法,但性能就会存在瓶颈――一旦共享的FSB带宽吃紧,整个处理器性能将受到限制。我们看到,在有关CPU浮点性能的基准测试中,Barcelona的性能可以超过竞争产品50%以上。


      电源管理 从齐步走到按需走


      除了架构上的创新,Barcelona还有一系列领先的技术特性。


      Barcelona的缓存部分新增了32路的2MB三级缓存,这是竞争对手所不具备的。在内存控制部分,过去K8架构的内存控制器是1个128位的界面,而K10h系列核心的内存控制器被拆分为2个64位的界面,且可以同时读写。这个拆分有利于多核心工作时更加灵活。在Barcelona上,内存控制器中除了有更多的缓冲区设计以外,还配置了新的预取器,这个预取器拥有自己的缓冲并不需要占用二级缓存或者三级缓存的空间,这很像主板北桥上的预取器,可以提升系统的性能。


      Barcelona最受欢迎的或许是在能源管理上的创新,这将为用户节省大量开支。首先发挥作用的是增强的Power Now!技术。现阶段的多核心处理器的每个核心基本都是在相同的电压下工作,就好像多个核心做着“齐步走”的操练;而10h系列核心的每个核心都能独立进行5级P-State调节,也就是说可以针对性地、独立地设定每个物理核心的工作电压和频率,这对节能是非常有帮助的。


      Barcelona电源管理的另一个领先特性是分隔电源层技术(Split Power Plane),使其内存控制器即使在全速运行时,也可以和处理器核心采用不同的电压,这一特性不仅令超频变得更加容易,还可以进行更多p-state 状态的转换,从而降低能耗。


      Barcelona还提高了“时钟门控”的数量,支持自动关闭逻辑电路中的非工作区域,以进一步节约能耗。其中“粗放门控”可以将闲置的整个逻辑电路块关闭,而“精微门控”则可以在适当的时候关闭某些逻辑电路片段。


      在普通用户喜闻乐见的应用层面上,巴塞罗那已经准备好随时支持DDR3、HT3.0等新一代技术,而对8核心处理器的支持也即将随着4 HT通道技术的成熟而就绪。
根据AMD的计划,Barcelona将于今年第三季度发布,而最近,AMD也在台北的Computex展上确认了这一消息,那就让我们拭目以待吧!