在飞机的设计过程中,运行流体力学软件CFD的高性能并行计算机已经成为不可或缺的研究工具。作为航空航天领域空气动力学计算的专用软件,CFD可以广泛应用于飞行器的亚、跨、超和高超音速的空气动力学计算和一些特殊气体动力学问题如直升机旋翼、导弹发射、座舱弹射、投弹、机动和气动弹性等。
我国航天部某研究所就通过一套由32个节点构成的小规模集群系统,为航天飞机大气摩擦阻力的研究项目成功搭建了一个高性能的并行计算平台。尤其值得关注的是,这套集群系统的计算节点并非传统的RISC小型机,也不是IBM、HP等厂商的品牌PC服务器,而是采用了技嘉生产的服务器准系统GS-SR168,在高性能、高可靠与高性价比之间真正获得了令用户满意的平衡。
弃RISC小型机,选集群系统
随着中国航空航天事业的快速发展,尤其是载人航天技术的巨大成功,我国科技人员对空气动力学的数值模拟研究提出了越来越多的需求,常规的计算能力远远无法满足复杂的大型飞行器设计所带来的巨大需求。
业内人士知道,在航空航天领域的CFD计算中,研究人员往往需要把飞机表面分成几百万甚至几千万个离散型的网格点,然后通过高性能计算平台求解方程,得出每个网格点的温度、速度、摩擦力等各种参数,并模拟出连续型的曲线,进而为飞机设计提供宝贵的参考资料。对CFD计算来说,网格点分割得越细密,计算量就越大,计算结果的精确度也就越好。测试表明,一个普通双路服务器节点所能计算的网格数不会超过100万个,因此,采用大SMP规模的小型机或者PC服务器集群就显得非常必要了。
“由于课题很大,需要大量计算,而单机计算时间长,所以需要寻求计算能力强的硬件设备。” 该研究所的张老师介绍说。“在04年9月项目启动初期,我们原计划是采购IBM的小型机,但由于军工领域采购小型机会受到美国政府的政策性限制,操作起来比较困难,而且小型机的价格也相当昂贵,而我们的经费也有限。后来接触到正高集群公司的技术人员,经过交流,我们发现如果用PC服务器集群,只需要用1半的成本就能完成同样的事情。”
于是,该研究所把目光投向了工业标准化的高性价比LINUX集群。在正高公司的帮助下,2004年11月该研究所采购了第一批12台技嘉GS-SR168搭建集群,运行一年多后,发现效果不错,在今年的二期工程中,又再次采购了20台GS-SR168。
技嘉GS-SR168服务器准系统
用技嘉服务器搭建高性价比集群
由于CFD是一种典型的浮点计算密集型和内存密集型应用,其对高性能计算机的要求主要有:
1) 具有很强的计算能力,尤其是浮点运算能力;
2) 有较大容量的内存以使前处理和求解时数据能完全驻留在物理内存中,经验表明,一般每个CPU至少分配1GB内存;
3) 由于CFD是一种稳态计算,数据的读写不需要随着时间变化,只要在计算完后一次性读写磁盘即可,因此采用主流、高性价比的SATA硬盘是比较好的选择。而且如采用SATA硬盘,在安装OS时,无需加载驱动,软件安装与运行会更加顺畅。
4) 要求具有支持高速、低延迟的通讯网络。一般而言,100个节点以上的CFD集群要求采用性能更好但价格也更昂贵的Myrinet或Infiband互连网络,以满足节点之间大量频繁的通讯要求。但对于几十个节点的小规模集群,采用主流的千兆以太网既能满足通讯要求,更重要的是性价比非常不错,可以大大减少用户的采购成本。
针对上述需求,经过充分认证和调研,该项目最终采用了32台配置为“双路英特尔至强3.0GHz 64位处理器、2GB内存、80GB SATA硬盘、双千兆网卡”的1U机架式服务器GS-SR168来充当计算节点和管理节点,采用千兆以太网为互连网络,配备正高集群管理系统(实现安装、作业调度、TVM、MPI等功能),从而构成了一套可以胜任2000-3000万网格点计算重任的高性价比集群系统。系统结构如下图所示:
基于技嘉SR168的正高集群系统结构
其中,技嘉GS-SR168是一款1U 机架式服务器,高度仅为1.68 英寸,甚至比标准1U(1.75 英寸)还薄0.2cm,使服务器在高密度部署时各主机间隔进一步加大,有效阻止热量传导,对整体系统稳定运行很有帮助。其产品规格特点如下表所示:
为什么选用技嘉服务器准系统?
尤其值得注意的是,技嘉提供的GS-SR168是一款服务器准系统。所谓服务器准系统,是指一种不标配CPU、内存和硬盘的服务器平台,而是由代理商或用户自己来选择处理器、 内存和硬盘,但不影响整个系统的性能和可靠性。
采用这种准系统主要能带来三大好处,一是具有比一般品牌服务器更好的灵活性,代理商或用户可以根据自己的需求选择更合适的CPU、内存和硬盘;二是性价比更高,由于省去了厂商的品牌附加费,因此,价格一般要比品牌服务器低10-20%;三是性能和可靠性能得到保证,跟DIY服务器不同,服务器准系统在出厂前经过了可靠性设计和严格的测试,因此能保证整机性能和可靠性。众所周知,作为专业的服务器主板制造商,技嘉具有国际一流的主板和平台设计、测试和质控技术,因此采用这种服务器准系统来搭建集群,能更好地实现性能与价格的良好平衡。
“在前期投标过程中,我们提供了一台单机到用户现场,安装了Windows 2000和第三方软件进行了48小时的加压测试,经过比较,测试结果与HP、曙光等厂商选测的机器结果相当,但是价格更具优势。”正高集群公司总经理胡正安介绍说,“正是这种性能与成本的良好平衡使用户最终选择了我们。”两年多来的实际运行也充分证明了这一点。在一期项目中,该集群没有出现任何故障,这也导致了用户的第二次采购。
该研究所的张老师证实说:“正高集群超强的计算能力和稳定性为计算课题节省了大量的时间,在使用中硬件的稳定和软件的协调运作都表现出了不错的优势,表现出了很高的性价比。”据了解,原来在一个单机上要跑1-2个月的课题,通过该集群只需要一周到半个月的时间,计算效率提高了数倍。
尽管高性能计算用户在选购硬件平台时一般要考虑很多复杂因素,如性能、可靠性、成本、服务、品牌等等,但正高集群之所以能在投标过程中一举击败更具品牌影响力的大厂商,并获得用户的二次采购,其选用技嘉服务器准系统平台无疑起到了非常关键的作用。技嘉GS-SR168既能满足服务器的性能和稳定性,实现整体软硬件的完美搭建,更是帮助用户赢得了高性价比,对于资金有限的教育、科研或中小企业用户来说,显然是非常不错的选择。