服务器在线12月15日报道 一个月前,IBM和美国伊利诺伊州立大学合作的数据中心破土动工,这座数据中心将来会用于放置装配了Power7处理器的IBM蓝海("Blue Waters")大规模并行超级计算机。这座数据中心的设计非常巧妙,对IBM来说也是一项艰巨的任务。
在前不久美国德克萨斯州奥斯丁市举行的2008年超级计算机大会上,有人称能源公司将放弃在任何政府机构或者签署了长期能源合同的企业中使用超级计算机已经为时不远,这当然是个笑话。但是这个尖锐的话题也让大家把关注的重点放在了这样的事实上:那就是能耗和制冷已经成为制约超级计算机可升级性的主要障碍。从1976年第一台Cray-1矢量超级计算机的横空出世至今,这个问题就一直存在。
太平洋西北国家实验室的研究学者史蒂芬.埃尔伯特解释说,大量的数据中心消耗的能量为60到70兆瓦,也有部分数据中心的能耗已经突破100兆瓦大关。"除此之外,你还必须考虑自己的能源公司或者解决这个问题,比如谷歌就是在其位于俄勒冈州的数据中心与
美国邦那维尔电力局合作的"。
根据IBM公司Unix硬件首席架构师兼蓝海项目负责人之一的Ed Seminaro介绍,数据中心面临的最大问题就是数据中心本身的低效运行。IBM公司在放置蓝海超级计算机的数据中心中采用的技巧可能将会引起其他计算机设备和服务器制造商的注意。原因很简单:没有比数据中心更关注计算性能的了。
通过Seminaro的计算,以一座具有代表性的高性能计算数据中心为例,数据中心中运行一台耗能300瓦的设备所需的输入功率为800瓦。Seminaro表示"这种能效真是太糟糕了"。以此推算800瓦的输入功率只能满足一台耗能300瓦的服务器。数据中心的能量转换硬件(包括不间断电源和交流电分配单元)耗能为160瓦;冷却塔,冷凝器,蒸发器和空气推动器需要140瓦。而风扇和吹风机等设备内置的制冷设备又要消耗50瓦。
服务器自带的电源又需占据800瓦输入功率中的150瓦。理想化估算运行一台服务器真实耗费的服务器能量为2.67个单位。而对于一台计算能力高达每秒上千万亿次的超级计算机而言,这种能效的低下势必代价十分昂贵。
这就是为什么美国伊利诺伊州立大学和蓝海超级计算机的设计在未来几年中试图实现以Power处理器为基础的高性能计算服务器性能的标准化,就像美国劳伦斯.利莫佛国家实验室耗费十年心力使用IBM ASCI Purple和蓝色基因/L超级计算机要做到的那样。
IBM公司对蓝海超级计算机的设计一直语焉不详,看起来他们是想创建一台拥有大约20万颗Power7处理器核心的数千万亿次计算级别的超级计算机。回顾今年7月IBM所做的蓝海公告,IBM谈及最多的是Power7处理器将采用45纳米制程工艺,将会放置多个核心。但是IBM公司Power Systems部门的总经理罗斯.莫瑞又跟笔者私下确认说Power7将是8核处理器。
不过他没有说明会采用那种类型的核心。可能是Power和其他矢量核心的混合体,就像目前在游戏机控制台和超级计算机上使用的Cell Power处理器一样。这种芯片使用的是一个64位Power核心和8个矢量型协处理器。
根据伊利诺伊州立大学国家超级电脑应用中心早期的声明,蓝海超级计算机的主存可能会超过800TB(每个对称多处理节点至少有32GB的主存)。初步的目标是外部带宽实现每秒100GB,最终能扩展到4倍,即每秒400GB。
走进蓝海
根据Seminaro的介绍,蓝海数据中心将占地大约10,000平方英尺,总共容纳162架服务器,分三列排序,每列分为5行,每行放置9架。蓝海超级计算机使用的Power服务器将使用目前最新的Power 575,这款服务器的2U机箱内配置了16个双核Power6处理器。这款机型最引人瞩目之处在于处理器和主存电路的右侧放置了水箱,可以连接到数据中心的水冷系统上进行散热。这样服务器就不再需要风扇来制冷了。(顺便提一下,这种2U型服务器是24英寸宽,而不是标准的19英寸)。
IBM目前还没有公布这种未来版Power7服务器的详细规格,不过看起来IBM公司将在2U机箱内放置64个核心,具体做法是他们可以将两个Power7芯片放置在一个陶瓷封装中来共享一个插槽,一个主板上可以有4个插槽。这样目前市场上的Power575服务器中插槽的数量和核心就能扩大4倍。这种2U机箱有望达到每秒两万亿次的浮点计算能力,最高可支持128GB主存。
这种每个2U服务器达到每秒两万亿次的浮点计算能力的Power7核心比起目前推出的仅有16核心的Power575服务器所达到的602千兆计算能力要强大的多(如果你做一下计算,你会发现Power7处理器的期望能力是以4GHZ的芯片为基础的)。总之,如果IBM公司在一个机架内容纳21台服务器,那么4GHZ核心和蓝海超级计算机中运行的每个服务器的64个核心能力可以达到6.8千万亿次。
回溯今年7月,熟悉蓝海计划的人士提醒我说Power7芯片的时钟频率大概会在3GHz到4GHz之间,而不是El Reg网站上最初公布的4GHz,他们还表示这批最初的Power7芯片交付给蓝海超级计算机的确切时间大致在2009年秋到2010年夏之间,而不是相传的2011年。因此假设最终是采用较低的时钟频率3GHz,那么大概仅能实现5千万亿次的计算能力。
至于Power 575服务器采用的水冷集群技术,蓝海超级计算机也将在构建服务器集群是沿用这种水冷系统。服务器将不再采用外部开关,但每个服务器互联架构上都会集成InfiniBand开关来连接存储系统。蓝海数据中心也将不再使用室内空调,而是使用水冷技术对高达60度的温度进行冷却,这对于服务器机架的冷却需求已经足够了,而且水冷方式还能节省用电开支。
IBM公司还将13,000伏的交流电电源降低到480伏,直接供给服务器。IBM公司还能将分布式直流电直接连接服务器,不过国家超级电脑应用中心将会选择200伏到480伏的交流电源或者400伏到600伏的直流电源中的一种。这意味着用户能改变他们服务器中分布式供电的方式,而且不用对服务器做任何改动。
蓝海数据中心还将充分利用空气节约装置,比如在气候适宜的地区,高性能计算团队可以利用外部空气来对设备进行冷却,伊利诺伊州就是这样的地区,它终年都是气候宜人的。数据中心中设备的设计输入功率大约为17.6兆瓦,能为大约15兆瓦的IT负荷提供支持。
Seminaro表示,据IBM公司估计数据中心将有98%的时间能实现这种能源分配功效,这也取决于一年中的气候,制冷基础架构将能发挥80%到93%的功效。在空气较冷的气候条件下,空气节约装置就更能发挥作用。
IBM公司希望放置蓝海超级计算机的数据中心能实现大约85%的整体能效。这样数据中心中一台耗能300瓦的设备就只需大约350瓦的输入功率。这将是个非常巨大的进步。