DoSERV IDF专题讲座 Nehalem经理谈四大亮点

DoSERV服务器在线 4月2日上海报道:很多人将本次IDF的亮点锁定为45 纳米Nehalem架构,这一全新架构即将于年底问世。在大会的专题演讲中,英特尔公司企业微处理器事业部总监Nehalem 架构开发设计经理白杰铭(Jim Brayton)介绍了Nehalem架构及其处理器的特性,重点从微架构、高速缓存组织结构,以及指令集增强和实现这些目标的关键技术方面进行阐述,并且展示了如何将这些能力与基于崭新英特尔 QuickPath 架构的平台相结合,满足服务器、工作组、台式机和移动平台的多种需求。

用1功耗换来〉1的性能

这个标题的意思实际上就是每瓦能耗比,要让处理器消耗能量的同时带来大于其的性能。

白杰铭表示,Nehalem架构及其处理器可充分发挥英特尔 45 纳米工艺技术的优势,将性能、能效、模块性和集成性提升至新的水平。据他介绍,在Nehalem设计之初,英特尔旨在提高可扩充的核心设计,而要达到这一目标,必须解决能耗问题。而随着45纳米高-k技术的出现,这一问题迎刃而解。同时,多体系架构技术可以有效提高每瓦能耗比,全新的SSE4、高缓冲层次结构和改进的锁定支持,可以处理更多的高速缓存中的指令,适合面向大型数据库的应用。

内存控制器

Nehalem集成了内存控制器,每个插槽有三个通道,每个通道3DIMM,支持DDR3 800、1066和1333。带宽的最高限度理论上可以达到每秒31.99GB,这确实令人振奋。Nehalem芯片每个核心采用的是256KB L2高速缓存,每个芯片采用8MB L3高速缓存。这有点类似英特尔现有的45纳米四核处理器,它采用的是12MB L2高速缓存(每个芯共享6MB L2高速缓存)。作为参考,AMD公司即将出炉的45纳米四核处理器将采用每个核心512KB L2高速缓存,每个芯片采用6MB L3高速缓存。

内存控制器本身的处理能力带宽最大限度为每秒64GB。但在处理器采用了集成内存控制器后,它就能直接与物理存储器阵列相连接,从而极大程度上减少了内存延迟的现象。

集成内存控制器可以支持DDR3-800, DDR3-1066, DDR3-1333,也为将来的升级预留了空间。至于如何为将来的标准提供支持还不得而知。

每个处理器都使用三通道,每个通道都能支持3组双列直插内存模块(DIMM)。这就意味着一个处理器最大限度能支持9列内存插槽。最少也能支持3列,即每个通道采用1组双列直插内存模块。这主要取决于所使用的主板的级别,每个主板都能配置为3列,6列或9列内存插槽。不过通常来说服务器至少都是使用双路对称多处理系统,采用两个Nehalem处理器,那么总共能支持的内存插槽就翻倍达到了18列!

QuickPath互连架构

Nehalem处理器中,英特尔开发了名为QuickPath Interconnect(简称QPI)的总线技术。QuickPath互连是一种可扩展的解决方案,可向多个处理器扩充,具备先进的RAS特性,以及低延迟高速缓存一致性,主要用于处理器之间和系统组件之间的互联通信(诸如I/O)。这样多处理器的每个处理器都能直接与物理内存池相连,每个处理器之间也能彼此互联来充分利用不同的内存。提及多处理器互联,英特尔公司正在计划将QuickPath互联架构应用于工作站和服务器市场。鉴于QuickPath互联架构本身所具有的升级性,它还能用于桌面电脑的高端单处理器安装。

QPI的传输速度最高能达到每秒6.4G,相当于每个连接能传输的总计带宽可达到每秒25.6GB,比AMD目前的解决方案要快了很多。但这并不是说AMD的总线技术不好,因为AMD的带宽也是可以扩展的。英特尔的QPI传输速度目前尚未得到验证,不过性能参数已经显示了它的实力。

可靠性,实用性和适用性特点为QPI的高可用性提供了保证。比如链接级循环冗余码验证(CRC),自愈型连接能避开错误区域重新进行自我配置来启用连接中好的部分。出现时钟密码故障时,时钟能自动改路发送到数据信道。

指令集

Nehalem为许多特定应用作了指令优化,如媒体加速和编译器是量化,加速的字符串指令和文本处理新指令可以更快地进行XML解析。

Nehalem还改善了循环流并发多线程,高度线程化的工作负载,对于诸如搜索引擎等应用又很好的支持。增强了算法,可以更快的对齐高速缓存方向。

这款芯片与酷睿2相比指令级并行计算能力有显著提升(英特尔公司宣称提升了33%),更加强大的高速缓存访问和同步运算法则,同时指令预测的功能也由于二级指令预测器的作用而有所增强。白杰铭将Nehalem处理器的同步多线程执行能力称之为超线程技术,并表示Nehalem处理器的性能与上一代相比有了显著的提升,而这一切主要取决于即将面世的中央处理器带宽的改进。