Intel多核技术解析

在整个 Pentium4 时代,Intel 不仅原本并无计划推出64 位处理器,甚至连双核计划也没有提上日程。但是,随着AMD 的步步紧逼,Intel 不得不加快研发的脚步。终于在Core 架构下,酷睿2 让Intel 重新吹响了冲锋的号角。

Core 2 Duo 表现令人信服

作为 NetBurst 的接班人,Core 核心架构完全改变了原有的发展模式,CPU 不再以牺牲超流水线效率来换取高主频。Core 架构的处理器将超流水线缩短到14 级,大幅度提升了整体效率,令CPU 避免出现“高频低能”的尴尬现象。现在,Intel Core 2 Duo 所表现出来的性能已经足够令人信服。当竞争对手还在描绘蓝图上的概念产品之时,Intel 显然已经领先一步。另外值得关注的是,目前双核 Core 架构的二级缓存容量高达4~6MB,且两个核心共享,访问延迟仅有12~14 个时钟周期。每个核心还拥有32KB 的一级指令缓存和一级数据缓存,访问延迟仅仅3 个时钟周期。在双核效率方面,Core 架构也将一改直接封装两个核心的低效率方式,而是互相之间可以通过内部总线传输数据并共享缓存,因此性能也大幅度提高。此外,低功耗的

智能电源技术(Intelligent Power Capability)和优化多媒体性能的高级数字媒体加速技术(AdvancedDigital Media Boost)也将帮助Core 核心架构“洗筋伐髓”。

安腾整装待发

在服务器领域,Intel 的安腾(Itanium)处理器也有着一定的市场份额,而Montecito 则是首款双核安腾2 处理器,其中最高规格的型号为9050,它的主频仅为1.6GHz,缓存容量却高达24MB。安腾处理器最大的特色便是它采用了 EPIC 结构,即显式并行指令计算集。EPIC 结构使用了超长的指令并将其分割成更小的指令,然后在芯片上进行并行处理。EPIC 设计理念的中心思想是:让智能化的软件指挥愚蠢的硬件,复杂性交给软件处理,硬件只需按序高速并行处理指令和数据。并行性的表达由每条指令开始,并行性的抽取、调度由编译器实现,从源头起开发指令集的并行ILP。

无论何时、无论何处只要可能就利用并行能力,因此效率更加高。对于那些经常对高速缓存进行操作的应用程序而言,提高缓存命中率是一个很重要的因素。目前我们使用的 CPU 在这方面已经做得相当不错,大约有80%以上的命中率。但是不要忘记,目前主流 CPU 的总缓存不足4MB,因此这也并没有什么了不起。对于安腾处理器巨大的缓存体系而言,要做到同样的命中率是相当困难的。为此,双核安腾2 使用了“判定”和“预测”技术。这两项技术去掉代码中的分支,进一步改善并行度和数据推测,这使得预测指令将在第一时间知道到底需要哪些数据,并尽量减少处理器的等待时间和内存延迟时间。此外,双核安腾 2 处理器还含有大量的寄存器,这大大减少了CPU 访问内存的次数,从而为提高缓存命中率提供时间上基本条件。

四核处理器改进在即

目前,Intel 已经在PC 市场推出了四核处理器,那就是核心代号为Kentsfield 的Core 2 Quad。Kentsfield 实际上是由两个双核CPU 组合而来,这一点很像之前的Smithfield 核心,也即90nmPentium D 核心。只不过那是基于NetBurst 架构,而Kentsfield 是由两个Conroe 处理器组成,基于Core 架构。我们建议大家先不要盲目否定组合封装,因为这样做也有很多好处,其中最主要的一点便是简化了生产工艺。通过这种方式,Intel 至少可以降低10%的生产成本。原有的生产线不需升级即可同时完成双核CPU 和四核CPU 的生产,他们可以在成品中挑选优秀的部分来组合Kentsfield,以达到更佳的功耗性能比,而且也能够保证产量。

当然,Intel 未来的四核处理器还是会走向一条四核完全独立的发展道路。以采用 45nm 工艺的四核版Penryn 处理器为例,它将拥有8.2 亿个晶体管,核心架构与现有的Core 2 有了明显区别。新工艺所带来的好处不仅仅是二级缓存那样简单,而是在架构设计方面可以作出全新的改变。Penryn 的核心面积只有107 平方毫米,因此芯片的核心面积要比当前65nmCore 2 Quad 处理器小25%。此外,Penryn 最高采用1600MHz 前端总线设计,桌面版本和移动版本依然支持1333MHz,这令其今后对芯片组的兼容性大幅度提高。高端版本的 Penryn 处理器将会内置12MB 二级缓存,这些“乍舌”的技术指标都令人对其非常期待。除了最新的 45 纳米工艺以外,Intel 还将在新款四核处理器上推出被称为“Deep Power Down”的技术,实现更低的C6 节电状态。新的 C6 节电状态可以将处理器的核心电压降至其所采用制程技术的极限,在该状态下,除了降低处理器核心频率以外,处理器还将关闭所有的高速缓存。在这种情况下,其功耗非常低。此外,EDAT 技术也是Intel 在功耗控制上引以为傲的新法宝。这项技术可以单独提高某个处理核心的频率,并将其他暂时不使用的核心关闭,以适应单线程任务或者只能利用一个核心的多线程任务。

Intel 的多核之路

Intel 表示,未来的处理器性能已不会像以前那样只注重工作频率,而会趋向多核搭配相关的应用技术,以此来提升实际应用性能。在 8 核心(2 到4,4 到8)以后,Intel 就会推出10 个核心以上的处理器,未来的处理器更将实现100 到1000 个核心结合在单芯片上。而要达成这么多的核心设计也必然需要生产制程的配合(如2010 年的22nm,2014 年的16nm,2016 年的11nm 和2018 年的8nm 等)。Intel 方面也将继续以摩尔定律为基准开发处理器产品,晶体管的数量在每代产品将继续倍增:如11nm 制程芯片将内置1280 亿个晶体管,而到8nm 制程时则会有2560 亿个晶体管。