近日,IBM公司和SUN公司分别揭晓了他们旗下的多线程系统:即IBM的64线程Power 595和用于T5140/T5240服务器128线程"维多利亚瀑布"("Victoria Falls")。
尽管这两款系统都支持大数量线程,但基于他们各自处理器设计要点的侧重不同,服务器处理工作负载的方式也不尽相同。采用32个处理器的64线程Power 595侧重于数据中心级别的应用,而两个处理器128线程的服务器T5140/T5240则最适用于网络服务。
这也可以理解,IBM公司的旗舰产品Power 595将主要针对SUN公司采用SPARC64处理器的SPARC企业级服务器,而并非要和SUN公司酷线程("CoolThreads")系统相竞争。
同样,SUN公司的企业级服务器T5140/T5240是将矛头对准了IBM公司的采用Power处理器的中端服务器,而不是与高端Power 595争锋相对。虽然这些最新的服务器系统还没有正面交锋,但两家公司都将他们的多处理器、多核心、多线程特性作为最大亮点。
但我们不能将POWER6线程与UltraSPARC T2 Plus线程混为一谈。为了避免大家将两种设计混淆,现将这两种线程做简要解析:
基本上,POWER6遵循了更为传统的设计理念,而UltraSPARC T2 Plus则着重于高水平并行设计,这种设计在许多网络应用软件中比较常见。Power 595的主频运行速度达到了5GHz,其采用的POWER6处理器每个芯片上有两个核心,每个核心有两个线程。
UltraSPARC T2 Plus每个硅晶片上放置了8个核心,每个核心支持8线程,每个芯片的线程总数为64。主频速度最高可达1.4GHz的UltraSPARC T2 Plus更侧重于多核/多线程合计能执行的性能,而不是像POWER6那样将重点放在每个高主频设计的单个线程的性能。POWER6每个线程的性能都遥遥领先,而UltraSPARC T2 Plus packages每个机架容纳的线程总数则独占鳌头。
SPECjbb2005基准测试结论显示,一台64线程的全配置POWER 595服务器执行能力是128线程的T5240的9倍(3,435,485对决373,405 SPECjbb2005 bops)。当然,64线程的POWER 595服务器的体积能装满整个机架(还不包括I/0机架),而SUN公司的T5240服务器的尺寸只有2U,也就是说2560个线程能装满40U大小的T5240。
时钟频率差异也并非POWER6和UltraSPARC T2 Plus之间唯一的区别。显然,POWER6线程和UltraSPARC T2 Plus的线程是不同的。IBM公司的同步多线程(SMT)设计能同时接收来自一个核心两个线程的指令。
两个线程(每个核心)只要不使用同样的执行单元,就都能在同一轮时钟周期内执行。由于POWER6有多重执行单元,每个POWER6核心通过这两个线程就能同时执行最高可达7条指令(这取决于需要那个执行单元)。虽然UltraSPARC T2 Plus每个核心能支持8个线程,但是它每个核心只有两个执行单元,因此最多只能同时执行两个线程的指令。
请注意以下这两个术语(尽管在销售的时候经常被混为一谈)。严格的说"同步"和"并发"对于处理器设计工程师来说并不是相同的概念。"同步"指的是在绝对相同的时钟周期内同时发生多重运行,而"并发"是指多重行为在某个时间片段和交叉范围内被激活,但并非所有的行为都在相同的时钟周期内真实发生。POWER6核心能支持两个线程的同步执行;而UltraSPARC T2 Plus核心有8个被并发激活的线程,但是只能同时执行其中的两个。
因此尽管所谓64/128线程听起来让人印象深刻,但还应该侧重于每"U"单位机架的性能,每瓦特的性能(尽管能耗很能难被精确的测算)和产品的性价比来进行相关的比较和衡量。显然,拥有16个处理器的Power 595服务器在执行工作负载数量上要优于两个处理器的T5240服务器,但是T5240服务器的尺寸只有2U(T5140是1U),而用于Power 595的处理器空间是20U(还不包括I/0机架)。
每个系统都各具优势。不可否认的是,Power 595和Sun T5140/T5240服务器不会有过多正面交锋。但是SUN公司最新的采用"维多利亚瀑布"("Victoria Falls")处理器的服务器将与以POWER6芯片为基础的Power 550和Power 570展开竞争。
目前在X86系统上运行的工作负载整合是IBM和SUN的目标。整合和虚拟化联合成为市场的王牌。这两家厂商都推出了多种虚拟化途径(诸如AIX Workload Partitions / Solaris Containers, Micro-Partitions / LDOMs)来允许单个服务器处理多重工作负载。
POWER6处理器的大容量高速缓存(每个核心4MB L2高速缓存和由两个核心共享的32MB L3高速缓存对决UltraSPARC T2由8个核心共享的4MB L2高速缓存)能为更多的虚拟化映像提供更佳的支持。
IBM公司的动态可扩展微分区与静态LDOM相比,非常适合计算需求变化多样的工作负载。因此POWER6在处理整合和动态转换工作负载方面更胜一筹。而另一方面,如果SUN公司的UltraSPARC T2 Plus从每个机架的成本测算线程/核心则要经济许多,对线程/核心的有效分配的担心也是没有必要的。
当然,如何选择取决于服务器在执行不同工作负载的表现。用户无论是配置POWER6还是UltraSPARC T2 Plus,都需要考虑工作负载的自然属性,真正理解那款服务器才最适合他们的需求。