SGI将展示Project Mojo高密度HPC

据消息人士称,超级计算机制造商SGI即将完成高密度封装的"Project Mojo"高性能计算设备的初步设计。

如果你一直对SGI如何将1PB计算能力填进一个机架服务器内(SGI在今年6月承诺将在一年之内实现)的话,那么答案就是SGI所谓的一种"魔棒"以及一个用于整合SGI和Rackable Systems服务器产品线的机架。虽然看上去并不是完全将1PB的计算能力融入到一个机架内,但仍然是一款比传统机架服务器和刀片服务器更加紧凑的设计。

早在美国国防部高级研究计划署在2009年6月非正式、2010年3月正式签发Exascale Challenge计划的数个月前,SGI与超大规模服务器制造商Rackable Systems就提出了他们打算将1PB计算能力融入到一个机架服务器内的想法。尽管SGI是以单精度测量方法衡量PB级计算能力的(这比使用双精度测量方法要简单一些),但Project Mojo仍然要求有一个不同的方法,不仅仅是将GPU或者其他类型的协同处理器集成到现有SGI机架服务器和刀片服务器中。

SGI产品营销副总裁Bill Mannel表示:"对于Project Mojo设计我们是从GPU和PCI-E规格开始着手,然后CPU都是围绕着这些进行配置,而不是从现有服务器开始,然后添加GPU。"

SGI在6月的时候并没有明确说将如何封装CPU和协同处理器加速器,但当时说过打算使用AMD的FireStream GPU、用于浮点运算任务的Nvidia Tesla GPU、以及Tilera的大规模多核Mesh网络互连处理器来加速Project Mojo中主CPU的整数处理。

事实证明,SGI所说Project Mojo系统中的棒状物是一个计算元素,深度接近机架深度(3英尺),宽度接近、高度略大于双宽PCI-E外设卡。Mannel并没有说这个棒状物将采用什么处理器,但是SGI可能会选择Intel至强和AMD皓龙处理器。考虑到Project Mojo是一个前端销售有限的试验性系统,所以可以合理地推测出SGI一开始将采用英特尔至强处理器,然后根据客户需要扩展支持皓龙处理器。

每一个棒都保留有2个双宽无风扇GPU协同处理器和2个处理器插槽的位置,并且在浮点模式下有属于自己的GPU,现在我们还不清楚整数模式下将使用多少个Tilera芯片。

Project Mojo系统将分为2种机架型号和2种不同的棒容量。高端设备将采用修改版Altix UV 24英寸刀片机架,另外一个将是19英寸代号"Destination"。前者将容纳80个棒,后者将容纳63个棒。

假设SGI在Project Mojo系统中采用6月底公布的AMD FireStream GPU,那么采用双宽FireStream 9370的24英寸机架设备的总GPU性能将达到422 teraflops,体积稍小的19英寸设备将达到332.6 teraflops。CPU不会增加太多处理能力。

如果采用Nvidia双宽无风扇的Tesla M2070 GPU,那么"魔棒"在单精度测量方法下的性能将达到2.06 teraflops,从而使24英寸机架设备和19英寸设备的性能分别达到164.8 teraflops和129.8 teraflops。AMD FireSteam 9370在单精度下比Nvidia有更大优势,但是AMD 9370在双精度测量方法下的性能只有528 gigaflops,相同条件下Tesla M2070的性能为515 gigaflops。在双精度下,最大的Project Mojo系统采用Tesla M2070和FireStream 9370的性能分别为82.4 teraflops和84.5 teraflops。

将2个处理器插槽和4个单宽无风扇GPU放在"魔棒"上要更有意义。这样使用AMD FireStream 9350无风扇GPU协同处理器将产生每个棒8 teraflops的性能,或者单精度下640 teraflops的聚合GPU浮点性能。采用4个单宽Tesla M2050,容纳了80个棒的机架设备将提供329.6 teraflops的SP数字运算性能。

目前SGI并没有透露任何可能的GPU协同处理器配置。另外,SGI从未承诺从一开始就达到petaflops级的性能,但仅表示有很多种途径可以在一年之内达到这个性能水平。这些所谓的"魔棒"只是方法之一。

如果AMD无法在今年年底向现有的Cypress芯片中集成原计划的下一代显卡(开发代号为"Northern Islands"),那么GPU的性能提升可能就成问题了。现在有传闻称,由TSMC制造的Northern Island GPU的确已经推迟了,可能还有一部分GPU(代号为"Southern Islands")是由GlobalFoundries制造的。AMD和Nvidia都对他们未来的GPU路线图缄口不提,但是他们可能会在即将召开的 GPU Technology Conference上谈一谈这个问题。

"魔棒"采用了Tilera协同处理器,可完成更多的整数运算。Tilera表示,Tile-Gx系列芯片的性能最高可达到每秒7500亿次,也就是在1.5GHz速度(2011年即将推出的Tile-Gx100芯片所能达到的速度)下每个时钟周期运行5个指令。

假设你在"魔棒"上采用8个Tilera 100核芯片,并将80个"魔棒"装进一个24英寸的机架设备内,那它的性能就是每秒480万亿次整数运算。

Mannel表示,目前Project Mojo设备的设计已经接近完成,今年11月SGI将在新奥尔良召开的SC10超级计算机大会上展示这款原型机,其中的"魔棒"和即将将从12月开始出货。