IDF 透过迷雾看技术发展趋势

    首次移师美国本土以外的Intel全球IDF大会上周吸引了空前的关注,在会上,Intel全面介绍了数字企业、数字家庭、移动、通信等领域的产品和计划,UMPC、45纳米、80核万亿次计算、Larrabee、Skulltrail……,众多的概念铺天盖地而来,让人眼花缭乱。而在为期两天的IDF轰轰烈烈闭幕后,我们试图深入到这些概念的背后,从技术层面上观察未来芯片的发展趋势。 
  
    芯片“集成”和直连架构,大势所趋 
  
    IDF上,英特尔展示了最新45nm制程的Penryn的设计和性能参数,以及下一代Nehalem平台的设计。英特尔宣布说,Nehalem将集成内存控制器(IMC)和集成图形芯片,并通过通用系统接口(CSI)来直接连接CPU和系统其他单元。 
  
    是不是有点耳熟?的确,集成内存控制器和图形芯片、还有系统内部的直连架构正是过去几年中AMD一直强调的领先优势,现在从英特尔这里听到,不仅感叹CPU架构设计经历不同发展方向后,终归一统。 
  
    显然,过去几年中英特尔多次宣讲过的“集成内存控制器和直连架构对系统性能并不重要”的言论又是一颗烟雾弹,如同当年追随AMD的64位技术一样,英特尔再次追随了AMD集成内存控制器和直连架构的设计理念。 
  
    紧随AMD,顺应加速计算趋势在IDF大会上,英特尔提出了一系列旨在加速未来计算的技术项目??包括Geneseo、Larrabee、QuickAssist??分别面向PCI-E总线加速、可编程的多核心架构和服务器加速器优化。 
  
    Geneseo扩展了PCIe 2.x规范,实现基于PCIe的加速技术应用,将首先在Clearspeed、DRC、高性能计算等领域应用。QuickAssist技术是英特尔优化服务器加速器应用的综合研究计划,支持第三方加速器,以在IA架构处理器内部开发集成加速器。前者基于PCIe总线上,后者在芯片内部,实现不同层次的计算加速,这与AMD的Torrenza如出一辙,显然很有针对性。 
  
    AMD于去年9月推出Torrenza计划,可以让第三方厂商在基于超传输总线的系统中实现基于HTX或者芯片级的加速,以发挥超传输总线的高速、低延迟以及开放性优势。目前,Torrenza已经得到了包括IBM、HP、戴尔、Sun等超过25家技术合作伙伴的支持,并已经在Cray的高性能计算系统中以及IBM和HP的服务器产品中实现了应用,远远走在了英特尔的前面。 
  
    而Larrabee则是英特尔规划中的基于IA架构的、具备大规模并行处理能力的可编程体系结构。它可以使用现有的软件工具进行编程,加速科学计算、虚拟化、金融分析等高性能计算应用。尽管英特尔一再强调Larrabee基于传统的x86架构,与竞争对手AMD和NVIDIA的GPGPU技术不同。但仔细分析他们的性能特点、应用领域,就不难发现Larrabee其实是在AMD和NVIDIA双重压力下推出的应对策略。 
  
    AMD去年11月推出了满足HPC特殊需求的专用流处理器,利用成熟的大规模并行图形处理技术,能够大大加速各类科学、商业和消费计算应用处理海量信息的时间。通过AMD的新型编译接口CTM,开发者能够随意访问流处理器中的原生指令集和大规模并行计算单元的内存,使流处理器能够像今天的CPU一样成为功能强大的开放式可编程架构。而NVIDIA也计划推出基于GPGPU概念的CUDA运算架构,实现 “基于GPU的计算”功能,NVIDIA声称其浮点计算能力可以远远超过目前最强的PC微处理器。 
  
    双核撬动80核,万亿次计算的殊途? 
  
    本届IDF的热门技术中,最引人瞩目的恐怕要数首次在国内公开演示的80核处理器项目了。根据英特尔的演示系统,这个80核处理器在实现1Teraflops(每秒1万亿次)运算性能时功率仅为41.97瓦特;在全速运行实现2Teraflops运算时功率为166.84瓦特。同时,据英特尔表示,2万亿次浮点运算目前还只处于演示研究阶段,实验室尚无实物出来,产品上市更要等上5年左右。这里可能有人要问,既然没有实物,那现场是如何做演示的呢?笔者对此也深有疑问,期待英特尔能够尽快有更多的相关信息公布。 
  
    就此可以推测,即使英特尔的80核处理器在实际产品开发中,能够顺利实现IDF现场演示的性能,具体产品上市也要等到5年以后。而反观竞争对手AMD,早已经在今年2月底宣布突破了万亿次浮点计算障碍。在旧金山的一次新闻活动中,AMD 展示了一个“单盒万亿次浮点计算”的系统,它运行标准版本的Windows XP Professional,利用AMD 双核皓龙处理器技术和两个新一代 AMD R600流处理器的超强性能,采用通用的”multiply-add” (MADD) 计算方法,能够实现每秒1万亿次以上的浮点计算。 
  
    与英特尔还在研究阶段的项目比,AMD已经拿出了实实在在的系统,在冲刺万亿次计算上,再一次走在了前面。 
  
    Skulltrail,继续挑战AMD 4×4平台? 
  
    AMD于去年11月底推出了4×4平台,是第一个双插槽多核心台式机平台,面向顶级发烧友的多任务处理需求。4×4平台在新一代多线程应用方面确立了新标准,有了Vista等软件的支持,其在多任务处理方面的潜力将会得到进一步发挥。另外,该平台的一大亮点是,随着AMD推出四核处理器,可以直接平滑升级到8核平台。 
  
    作为对AMD的回应,英特尔在CES2007上推出了类似的V8系统,V8包含了两颗四核心的至强处理器。不过与可以支持四颗显卡和12 个SATA的4×4平台相比,V8并且只能配FB-DIMM内存,并且只支持一个PCI-E插槽,应用受限,难以抗衡。 
  
    于是,在IDF上英特尔又推出了一款代号为“Skulltrail”的计划,将于今年晚些时候问世。该平台提供两个CPU插座,将采用两颗QX6800,并为高级图形处理配备了四个PCIe插槽。现在看来,Skulltrail应该可以与8核的AMD4x4平台一较长短了。但具体如何,还要等系统上市后才知道,我们拭目以待吧。 
  
    SOI,想说爱你不容易 
  
    绝缘硅技术(SOI)通常能带来25%~35%的CPU性能提升,并降低功耗1.7~3倍。AMD的全线CPU产品已经广泛采用,以提供高性能的同时,降低功耗。另外,SOI还被应用在多种RISC和CISC处理器上。 
  
    在IDF演讲中,英特尔技术与制造事业部高级院士Mark Bohr表示,英特尔对SOI技术不感兴趣,至少在到达32nm之前没有。因为英特尔认为SOI工艺成本过高,而且带来的性能提升非常有限,不过32nm时代的“三栅极晶体管”技术有可能从SOI中获益,因此英特尔会在未来考虑接纳SOI。 
  
    领先的制造技术一直是英特尔标榜的,而日后32nm制程又不得不采用SOI,做上述表态,也足见其用心良苦。 
  
    AMD的今天,英特尔的明天? 
  
    最后,不得不承认,处理器行业日益激烈的竞争,让CPU计算乃至图形处理技术、两大芯片巨头英特尔和AMD在众多的技术发展方向上出现了惊人的相似,在许多技术发展方向上,英特尔正对AMD亦步亦趋。就如TOM’s Hardware最近报道中所说 “我们没法不注意到太多项目都似曾相识,从双插槽的发烧级平台、QuickAssit、Larrabee到集成显示芯片的Nehalem等等,与AMD过去几年里推出的计划有太多的相似之处。当然,开发这些技术需要时间,而且英特尔也有可能比AMD更早地意识到其中的某些技术,但看起来很明显的是,英特尔在关键技术上在追随AMD。”