揭秘英特尔四核至强7300系列服务器处理器

      全新四核英特尔至强7300系列服务器处理器及其平台的出现将加速新一代刀片处理器在OEM厂商中的应用。4个4核Tigerton处理器可以集成到 全新四核英特尔至强7300系列服务器处理器平台上实现4路4核刀片服务器,再加上高效率的酷睿架构及着重加强的探听过滤器,这对于任何高端用户而言都是难以抵挡的性能诱惑。
  
      近日,英特尔终于正式发布了基于酷睿架构的 全新四核英特尔至强7300系列服务器处理器,并且配合一系列先进技术,成功地展示了英特尔在4路服务器上的实力。



  
      四路+酷睿架构
  
      相比Netburst架构,酷睿架构优势明显。此前,英特尔已经成功推出了Xeon DP 5100/5300家族,全新的酷睿架构设计使之表现非凡,在两路服务器市场可谓出尽风头。
  
      然而,面对竞争对手咄咄逼人的气势,Intel终于决心动用“终极武器”。全新的Tigerton 4核处理器终于浮出水面,这也是Intel在服务器领域的第一款4路酷睿架构产品。这款全新产品的命名依然是Xeon MP处理器,只是改用全新酷睿架构之后内核变为Tigerton,产品型号为Xeon 7300 MP。
  
      Tigerton 4核处理器由两个原生双核组合封装而成,全面采用内部总线传输数据并共享二级缓存,因此双核心效率也大幅度提高。在两个双核心之间,其连接技术也有所改进,进一步降低了不同核心之间的延迟,而且前端总线的提高对于充分发挥四核心技术也有较大的帮助。Intel还在发布现场演示了一个图像渲染过程。演示先是在单独一个核心上进行,然后再让16个核心同时渲染。在经过多线程处理优化的POV-Ray中效果显著,16核心的成绩甚至达到了单核心成绩的16倍以上。
  
      不过,功耗和发热量依然是困扰当前高端处理器的难题。Tigerton的TDP功耗最高达到150W(主频为2.93GHz)。平心而论,作为4路处理器,Tigerton的TDP功耗已经算是控制得非常不错的。惟一的遗憾便是45nm工艺没能得到应用,或许这也是Intel在今年下半年的重点任务之一。
  
      专用连接通道
  
      自从在移动计算领域推出迅驰之后,Intel的平台化运作概念越来越强。与Tigerton处理器搭配的芯片组代号为Clarksboro,它们一起构成了 全新四核英特尔至强7300系列服务器处理器平台。新平台放弃了目前Tulsa级别服务器的双独立总线架构,改为在每颗4核芯片与芯片组之间使用专用连接通道。以往,双独立总线架构要求每两颗处理器共享芯片组连接,因而带宽不足,容易形成访问瓶颈,专用连接架构则会有效改善这一弊端。
  
      事实上,我们也可以把专用连接通道理解为4个独立4核处理器在这个平台里使用的点对点技术。换一句话说就是,Clarksboro芯片组解决了前一代基于英特尔 Xeon CPU多核心系统最主要的瓶颈:共享前端总线。不过,略微让人有些失望的是,英特尔并未在Tigerton处理器上启用已经技术成熟的1333MHz前端总线,而Clarksboro芯片组又完全能够支持1333MHz前端总线。之所以放弃1333MHz前端总线,很大一部分原因是点对点的专用连接通道已经基本解决了16个内核的前端总线带宽。此外,在内存频率及成本搭配方面,当前1066MHz前端总线也显得相得益彰,不会让用户被迫使用高频率内存。
  
       Snoop Filter


     英特尔除了在 全新四核至强7300系列服务器处理器平台上积极鼓励更大的缓存体系之外,还在节点内部通信量使用了探听过滤器(Snoop Filter)。
  
      进一步提升CPU与系统内存互联的有效性也是多路服务器必须面对的平台,因此Snoop Filter也是一种特别的缓冲器,其中包含有处理器所有的数据信息。由于使用了MESI协议用于确保基于多核心处理器平台缓存的一致性,因此该平台的每一块处理器必须时刻注意另一块处理器的总线情况,而使用Snoop Filter将有助于减少处理器的总线发生数据堵塞情况的发生。
  
      当出现高速缓存未中时,Snoop Filter将增加到发起CPU的总线上。随后,Snoop Filter拦截探听,并确定是否必须将探听传递到4核中的另一个总线线段上。如果读取请求上同一总线上的另一个处理器上得到满足,则取消探听过滤器访问;如果没有得到满足,Snoop Filter访问的结果将确定是否进行下一个操作。当然,也有可能在读取请求过程中丢失了探听过滤器,此时就直接从内存返回数据,进入下一个循环。与以往使用简单的转发器相比,探听过滤器在4路系统上可以提升10%~15%的性能,而面对16内核的全新四核英特尔至强7300系列服务器处理器平台,其性能提升幅度将会更加明显。


      FB-DIMM引人瞩目


      在 全新四核英特尔至强7300系列服务器处理器平台中,英特尔终于启用了FB-DIMM内存,配合DDR2 667模式实现比较理想的性能表现。虽说采用多路并行的内存架构设计可以有效地提升内存带宽,但受目前DDR2内存自身架构的制约,要实现类似4路并行设计是有相当难度的。因为目前的内存主要是采用传统的64位并行设计,即北桥芯片的内存控制器与内存模块之间均通过64位的并行总线来数据交换,但此类并行总线设计有一个最大的缺点,即相邻线路很容易受到干扰,这可是服务器领域的大忌。


      相反,在FB-DIMM结构中,每个DIMM上的缓冲区是相互串联的,之间为点对点的连接方式,数据会在经过第一个缓冲区后传向下一个缓冲区。这样,缓冲区与内存控制器之间的连接阻抗就能始终保持稳定,从而有助于容量与频率的提升。此外,在内存控制器与FB-DIMM缓冲芯片内都有专门的发送和接收控制单元,数据读出和写入操作可以在一个周期内同时进行,相互不干扰,这相当于将内存系统的延迟时间缩短了一半,对性能提升有着不可低估的作用。


      在今年第一季度,英特尔表示传统Tulsa处理器占4路服务器处理器产量的85%。这个比例要在第二季度提高到97%以上。然而,当Tigerton处理器在第三季度推出的时候,Tulsa处理器的比例将下降到85%,Tigerton处理器的比例将占其余的15%。在今年第四季度,Tulsa处理器的比例将进一步下降到45%,而Tigerton处理器的比例将提高到55%,成为主要的4路服务器处理器。