服务器厂商赶GPU大潮 刀片上使用GPU

DoSERV服务器在线2010年9月28日 国际报道:本周服务器制造商都云集在由图形卡和图形协处理器制造商Nvidia 公司在圣何塞市举办的图形处理器技术大会上。这些制造商都嗅到了金钱的气息-就是各种各样高性能计算的价值所在,包括传统的高性能计算模拟,电子设计自动控制,数据分析,金融建模,机械可视和数字媒体等。许多应用软件目前只能触及到图形处理器的外延,各大厂商都希望能在这个领域更进一步。

自从服务器制造商需要体积更小的图形处理器和使用服务器自己的制冷风扇来保证图形处理器的冷却以来,今年六月推出的无风扇型M2050和M2070图形处理器就成为混合图形处理器-中央处理器应用的重要组成部分。(带风扇的图形处理器体积都太大,以至于需要萨大小的服务器才能轻松放进)。毫无疑问目前的M系列图形处理器是来自Nvidia公司的,还有AMD公司今年6月推出的FireStream 9350和9370无风扇图形处理器协处理器。服务器制造商最终会将这些处理器配置到他们的硬件设备中去。

超级计算机制造商Cray公司表示,本周举行的图形处理器技术大会展示了一系列应用在最新XE6大规模并行计算系统上的刀片服务器,能让来自Nvidia公司的Tesla图形处理器协处理器与X64处理器配合使用并完成浮点计算任务。

受益于2004年2月收购OctigaBay公司的举措,Cray公司掌握了将现场编程门阵列和其他类型加速器应用于大规模并行X64系统的经验。在接受E1 Reg采访时,Cray公司产品事业部副总裁巴里.伯顿表示,Cray对于配置在超级计算机中的组件非常精益求精,但是图形处理器协处理器已经足够成熟,他们的超级计算机用户也表达了他们对图形处理器加速器的兴趣。毋庸置疑,大规模并行X64服务器所达到的每秒千万亿的计算能力需要4500万美元资金,Cray公司自己销售的XE6系统即是如此。

伯顿并没有对Tesla 20图形处理器协处理器如何配置在XE6超级计算机中作出详细的解释,他们的XE6超级计算机是由配置皓龙处理器的8路服务器和今年5月作为完整系统推出的"双子星"XE互联架构组成的。伯顿言之凿凿的表示,Tesla图形处理器会配置在刀片服务器中,可能是使用PCI-Express互联架构的皓龙刀片服务器,他们将使用双子星互联架构来共享数据和承担计算任务。

Cray公司计算在刀片服务器上配置新一代Tesla图形处理器,这款代号为”Kepler”图形处理器将在2011年推出。伯顿表示,Cray公司作为AMD图形处理器的合作伙伴,将持续关注AMD推出的图形处理器并正在讨论如何将这些图形处理器应用在他们的大规模并行超级计算机上。就像Cracy以前使用两种X64处理器一样,毫无疑问他们也会使用两种图形处理器加速器。

除了图形处理器,公司今天还宣布其使用SGI的NUMAlink 5互联架构将共享内存并行超级计算机中配置的英特尔至强75000系列处理器核心最高扩展到256的高端Altix UV 1000并行超级计算机也将配置Tesla 20图形处理器。根据SGI公司产品营销部门副总裁比尔.曼恩的说法,公司将在超级计算机中插入1U图形处理器S2050机箱,在机箱内将容纳两个图形处理器。Altix UV刀片服务器配置了PCI-Express升级卡和S2050连接到刀片服务器上。

不过你在Altix UVs超级计算机上无法实现图形处理器和中央处理器插槽一对一的配对。你只能将这些S2050中的四个放到Altix超级计算机中的每个256插槽中。重要的是Altix UV设计的单个内存空间和高速NUMAlink 5互联架构意味着使用图形处理器协处理器的应用软件可以将数据收集到主存中,并且以非常快的速度直接输送到图形处理器,曼恩表示这在普通的图形处理器-中央处理器集群上是不可能实现的。

SGI公司还能支持Octane III个人超级计算机,Altix XE 工作组服务器和Altix ICE X64集群中的Tesla 20图形处理器协处理器。SGI在他们的Rackable Systems也为用户提供了高性能计算领域的定制服务器设计,可以为网络用户使用。这些设计包括紧凑机箱设计,低热量和图形处理器等。

或许今天在图形处理器技术大会上推出的最有趣的新机型来自Moscow的T-Platforms,这是一款非常智能的服务器,在7U刀片机箱内能容纳16个刀片服务器,每个刀片服务器配置了两个英特尔至强处理器和两个Tesla X2070图形处理器协处理器(这是笔者第一次听说X2070图形处理器,但是看起来M2070已经有了这样的配置).TB2-TL刀片服务器有一些实际的机械构造。内存条放在服务器边缘来保证刀片的体积够小,整个刀片服务器被巨大的热量接收器所覆盖。带有热量接收器的刀片服务器外形如下:





图示:T-Platforms T-Blade图形处理器刀片服务器

正如你所看到的,图示右侧的就是Tesla图形处理器协处理器。T-Platforms称,X2070图形处理器可以完成515千兆的双精度运算,可以匹配M2070的无风扇图形处理器规格。计算刀片可以容纳两个英特尔低压L5630处理器,这都是主频为2.13GHz的40瓦四核处理器。刀片服务器最高可以容纳24GB主存,有一个千兆以太网端口和两个传输速率为40GB的Mellanox InfiniBand端口。以下是T-Blade 2机箱背面的样子:

T-Platforms公司的产品营销总监亚历克斯.南柯特表示,T-Blade 2机箱可以配置两个来自Mellanox的36端口InfiniBand交换机。当将这些容量汇总在一起,配置着中央处理器-图形处理器的T-Blade 2系统在一个7U机箱内可以达到17.5万亿计算能力,售价约为30万美元。如果你购买十个机架,那么60个刀片服务器的价格需要2400万美元-你基本就接近了超级计算机世界500强排行榜榜首了。唯一的不同是你必须具备实际应用图形处理器的代码。

T-Blade 2机箱和图形处理器-中央处理器刀片服务器将在今年的第四个季度面向初始用户推出。他们将在2011年第一季度大规模上市。Nechuyatov表示,T-Platforms就是借图形处理器技术大会的机会来扩大影响力,事实上他们安装在莫斯科大学的只有中央处理器的刀片集群已经跻身2010年6月公布的超级计算机世界500强排行榜并位列15位,打破了高性能计算市场由西欧和北美一统天下的局面。T-Platforms目前在全球拥有超过200家用户,在莫斯科,汉诺威,基辅和台北有自己的实验室。

来自图形处理器技术大会的其他新闻还有,IBM公司明天将推出针对其BladeCenter系统的图形处理器刀片服务器。惠普公司也传出打算为他们的BladeSystem系统推出图形处理器刀片服务器的消息。我们听说的是惠普刀片将在10月推出。