探营亚洲第一超级计算机:关键技术仍靠进口

6月15日,"魔方"超级计算机将正式对外运行,6月10日,本报记者探访"魔方"的新家–上海市超级计算中心的机房。

67个2米左右高、1米左右宽的黑色柜子并排站在100平方米左右的玻璃房里,柜子上各色小灯闪烁,头顶上是交错密布的电线,房间温度为22摄氏度,玻璃房外是数台电脑显示器和穿白衣鞋套忙于调试机器的工作人员。

"魔方"超级计算机是中国首台国产百亿次超级计算机,型号为曙光5000A,由中科院计算所、曙光公司和上海超级计算中心联合研制,研制费用达2亿元人民币。

曙光5000A峰值计算能力超过每秒200万亿次,全机总储存容量大到500TB(千万亿字节),位列全球最快超级计算机排行榜TOP500第十,亚洲第一。目前世界上最快的计算机是IBM公司研制的"走鹃",造价1亿美元,运算速度达每秒1000万亿次,主要用于美国核物理研究。

超级计算机的心脏就是这些黑色的柜子,包括42个节点机柜、10个互联网机柜、15个存储机柜。每个节点机柜里装有200颗CPU、800个核。

"魔方"芯片是AMD公司生产的"巴塞罗那"4核芯片、4路刀片系统、8路机架式节点和Infinibang高速互联的体系结构,还采用了低功耗的处理器和内存,先进的水冷散热系统和刀片结构,可以有效控制用电量。

曙光6000超级计算机正在研制,预计2010年将推出千万亿次超级计算机,曙光6000机型会部分采用国产"龙芯",部分采用AMD或者英特尔芯片。这种混合异构体系将"前台"处理如编译与"后台"计算结合,解决兼容性、成本、耗电等问题。

"魔方"大用途

上海超级计算中心副主任、首席工程计算工程师李根国博士介绍说,理论、试验和计算是现在科技创新的三大支柱,而超级计算机则是高端计算能力的支撑,既可以对物理现象仿真和模拟,对复杂数据分析,也可以用于产品设计中复杂的设计计算。

此前,上海超级计算中心使用的型号为曙光4000A,已经用于大飞机研制、核电工程、汽车碰撞过程防震模拟、大型隧道工程的抗震安全评估。而在数值天气预报、药物作用的微观机理研究以及石油勘探数据分析等多个领域,计算机模拟是唯一可行的研究手段。

该中心负责高性能计算机用户的副主任袁俊解释说,比如在气象预报方面,之前都是运用卫星,地面观测站进行观测,根据过往的数据进行人工预测和判断,但这样并不十分准确。如果运用超级计算机把过往的数据输入,建造一个模型,就可以定时定量的预测天气。

在气候动力学方面,超级计算机可以模拟未来气候变化,比如,温室效应在多大程度上会改变气候。

在人类基因图谱的测序中,超级计算机可以用来分析巨量的人类基因组片段,袁俊说,遗憾的是,现在超级计算机运算能力已经超过每秒钟千万亿次,仍然没法完全测出具体人类基因组对应的功能,而这正是人类寻找基因组信息的最大动力。

以汽车制造为例,运用超级计算机技术的汽车生产周期已经由36个月降到了18个月以下。而波音777飞机的研制周期也从8年缩短至5年,工程返工量减少了50%。

买软件花了四千万

"魔方"的一些关键设备和技术仍然依靠进口,比如CPU就是AMD公司生产的"巴塞罗那"。

中国大型专业软件仍靠进口的格局也桎梏了超级计算机的发展。

"我们二期建设的时候买了一批软件,花了4000万人民币。"李根国说。

此外,"魔方"计算机,包括此前的曙光4000等系列,都存在一个损耗率和耗电量的问题。

一般而言,超级计算机的使用寿命约为6年,以"魔方"为例,每年的折旧就大于3000万人民币。

因为超级计算机的维护要求不断电,还有大量空调降温设备,一台"魔方"每月的电费就要100万元。此外,"魔方"在维护方面也很娇贵,中心配备了十多个工程师"伺候"它。

"魔方"必须在较低温度下才能运行,不然就会"当机",在李根国看来,超级计算中心更新设备最好的周期应该是一个通用超级计算机为主,另外每年更新1到2个专用的小型的超级计算机,这样是最有效率和节省的。

助推大飞机项目

中国唯一的一台"魔方"计算机进驻上海,大飞机项目也成为上海超级计算中心的用户。

袁俊告诉记者,中国大飞机的研制仍处在方案设计阶段,总体、气动设计的最为重要手段即是数值模拟计算。

他举例说,飞机的机翼设计是很关键的一环,直接决定飞机的性能水平,如升力、阻力、燃油经济性、稳定性。

此次翼型设计,所有设计单位和校核计算单位无一例外采用了各种计算流体力学数值模拟手段。共进行了27幅翼型,共1000多个状态的校核计算。

上海飞机设计研究所及其合作伙伴在大飞机高低速机翼设计、大飞机翼身组合体设计、发动机吊挂设计等方面,也借力超级计算机。

大飞机研制已经全面展开,其多项研究仍然需要超级计算机的配合,包括:气动布局研究、部件、优化设计、全流场分析、动力影响计算、结冰计算分析、气动噪音分析和环境温度分析等。

以2008年年底试飞的国产支线飞机ARJ21-700为例,凸显了超级计算机的重要性。这或许是上海花巨资构建"魔方"的动力之一。

在ARJ飞机方案设计的初步阶段,超级计算加快了研制进度,减少了风洞试验次数,进行了大量优化设计。在其详细设计阶段,超级计算机做的工作包括:对飞机的各种部件之间的融合设计分析,确定飞机的不拘形式,如机翼与机身融合设计、翼尖装置与机翼融合设计、机翼或机身与发动机短舱挂架融合设计等,通过对部件细节优化设计达到设计要求。仅ARJ飞机研制过程,曙光4000A就为此项目服务超过5年,使用机时超过100万CPU小时。