IT跨界新航标 英特尔Silvermont架构

近日,英特尔公司宣布推出全新的低功耗、高性能Silvermont微架构。Silvermont架构是英特尔面向移动领域(涵盖手机、平板、微服务器、网络、存储、车载系统、笔记本以及其他智能终端等等)推出的Atom下一代全新架构。

这款基于英特尔22纳米三栅极系统芯片制程技术的全新设计,大幅提升了性能和能效。与当前一代英特尔凌动处理器内核相比,Silvermont微架构提供了约3倍的峰值性能,或在同等性能下功耗降低约5倍。在Atom特定平台首次引入了乱序执行架构,从而更好地满足从智能手机到数据中心等细分市场对于低功耗、高性能的要求。

IT跨界新航标 英特尔Silvermont架构

如果你关注过英特尔Atom家族演进历史的话,你就会发现英特尔对其微架构不断创新,从45nm推进到32nm制程工艺。但其内核代码 为Saltwell、制程为32nm架构平台沿用了此前的Bonnell设计——仍然采用顺序执行,也就是采用牺牲性能来获得低功耗的优势。

IT跨界新航标 英特尔Silvermont架构

英特尔Atom产品路线图

而如今,Silvermont微架构摒弃了过去的做法,采用乱序执行体系,在不牺牲性能的基础上同时确保低功耗。英特尔对此新架构信心满满,“能够做任何事”,并承诺每年对其进行更新(通过英特尔制造工艺优势,在22nm基础上提升至14nm Airmont并不断推进。)

IT跨界新航标 英特尔Silvermont架构

Silvermont微架构新特性

其实我们可以将英特尔此次微架构升级看做是对Atom在以下三大领域的创新:性能提升;大幅降低能耗;处理器技术的优化。相比传统的性能提高能耗降低,此次架构升级并不具有排斥性通过牺牲某些功能或者性能来满足其他需求。接下来,我们将全方面为大家介绍Silvermont微架构以及其能耗管理、发展展望等。

刚才我们提到,Silvermont采用了乱序执行引擎,能够在Saltwell的基础上获得更大的性能提升(Saltwell目前的设计在其他SoC市场上仍具有强大竞争力)。此外,英特尔将继续采用宏操作以更有效地处理某些x86指令集。

IT跨界新航标 英特尔Silvermont架构

Saltwell流水线示意图

32nm的Saltwell流水线分为16个周期,由于它采用的是顺序执行,即使某些宏操作不需要访问缓存也需要逐一经历这些周期。因此,分支流水线就会浪费13个周期。而在Silvermont架构下,宏操作可以绕过这些不必要的访问和执行阶段,因此分支流水线只需要经历10个周期。

IT跨界新航标 英特尔Silvermont架构

Silvermont流水线示意图

在Silvermont架构中其每个内核都得到改进,包括更大的分支预测、改进的执行单元和更大的缓存支持。Silvermont进一步减少时延、提高吞吐量。采用了革命性的3-D三栅极晶体管的英特尔22纳米系统芯片制程进行了设计与共同优化。全新的IA指令和技术提高了性能、虚拟化和安全管理能力,能够为更加广泛的产品提供支持。

IT跨界新航标 英特尔Silvermont架构

Silvermont Atom架构图

对于Atom来说其首批产品采用的是单核心设计。但没多久英特尔发布45nm的Atom就采用了双核心设计。而此次发布的Silvermont可扩展最多至八个内核。

L2高速缓存对于内核性能的发挥起着至关重要的作用,低延迟、高带宽。英特尔没有采用在多个内核上共享L2缓存的做法,而是改为使用模块的设计理念。也就是每个模块都包括一对内核和1MB的L2缓存(前一代产品为每核心512KB的L2缓存)。每个核心、L2缓存和内核缓存之间的接口都由电源接口控制。这样设计可以实现每个模块中不同内核分别以不同频率运行。

IT跨界新航标 英特尔Silvermont架构

Silvermont模块化设计示意图

模块之间的通信采取点对点独立的读写通道,完全取代了前端总线拓扑结构。而在Nehalem和Westmere英特尔将IDI视作其模块化通信的关键,这也是此次新架构与以往不同的地方。

IT跨界新航标 英特尔Silvermont架构

Silvermont架构新特点

与此同时,英特尔也优化了单线程性能,从原来的基础上新增了兼容ISA的指令集架构。SSE4.1, SSE4.2和POPCNT(整数寄存器)。另外,AES-NI加速和安全密钥(包括RDRAND指令和数字随机数发生器)也被添加进来。

Nehalem处理器上采用的VT-X以支持虚拟化加速的第二代技术,也被引入Silvermont架构,同时也支持虚拟处理器ID以及不受限制的访问(允许KVM客户端访问分页和未分页模式代码)。

为了最大化提高32nm制程设计的Saltwell的时钟频率,英特尔在可用热功耗设计范围内采用了P状态智能调节的技术。也就是类似于根据热、功率和电能等测量值进行睿频加速。相比提升性能更为重要的是,还可以应对突发情况。

在移动设备领域,由于采用的架构和工艺不同,移动端的芯片往往都是“开足马力”、“油门踩到底”的全速运行,直到设备死机、重启,然后周而复始。对此,英特尔此次推出的Silvermont架构将从根本上改变这种现状,在设备出现这些问题之前就通过智能调节主频来避免问题的发生。

IT跨界新航标 英特尔Silvermont架构

不同能耗管理对比

SoC片上系统的电能可以在内核和晶圆上的其他IP(Intellectual Property)之间共享,当然也包括第三方的IP。下面的图片展示了内核可共用电源,内核也可以从GPU临时调用,也就说内核可以动态随需扩展性能。这种设计理念来自睿频加速,但采取的算法和执行机制并不相同。

IT跨界新航标 英特尔Silvermont架构

不同电能状态下的内核、IP模块工作机制示意图

从上面介绍的我们不难看出,英特尔已经实现了很多在企业级平台才有的根据电能状态调整模块运行的功能。Silvermont基于模块化设计,子状态能够支持基于策略的软件控制(L2缓存)。

IT跨界新航标 英特尔Silvermont架构

能耗与性能

基于每个内核和模块化设计对于Atom来说又迈出了一大步。由于Atom是SoC(并不是单个处理器),英特尔可以充分利用多个版本的22nm新品来最大化提升性能、提高计算密度。因此,英特尔芯片优势、架构优势和系统优化会带来功耗的控制问题。也就是英特尔提出的“宽动态”运行。

IT跨界新航标 英特尔Silvermont架构

采用Silvermont平台与其他平台平板电脑功耗性能对比

长期以来,英特尔在移动端的表现往往受制于高能耗而失去大片江山。但此次新推出的Silvermont微架构,增进了在更广范围动态内对性能和能效进行无缝升降的支持,可以更好地满足从智能手机到数据中心等细分市场对于低功耗的要求。