高性能计算在气象行业中的运用

近年来,中国天灾连连,各地深受由地质灾害带来的众多破坏性的不良影响。在这样的悲情与无力下,人们对灾害预警以及防护措施有着史无前例的急迫需求感。而国家为了更好的保证国民的安全以及加强对预警能力的把握,国家在各地加大了在灾害预防方面的重要设施,力求通过科技的力量把这些无可避免的灾害利用人类现有的能力将灾害的程度降到最低点。

特别是海洋的领域,随着气候环境的变化和污染的严重,我国各地加大了在海洋环境预警监测预报等方面的设施。

高性能计算在海洋监测领域的应用

江苏省海洋监测预报中心为了更好的监测海洋的情况,避免受突如其来的海洋灾难的影响。在我国高性能服务器知名厂商曙光公司的协力下,成功建设了一套具备浮点计算量巨大、通信密集度高、系统稳定性高以及拥有性能非常出众的I/O能力的海洋环境数值预报系统,它具有极佳的效率及极佳的扩展性,能够有效助力该中心监测海洋现实情况。

曙光公司秉承"自主创新 服务中国"的企业精神和理念,结合江苏海洋监测预报中心的特点和需求,以及曙光自身多年在高性能计算以及在海洋与气象预报领域的积累,为该中心配置了一套具有先进性、高可用性、完整性、低功耗、高可扩展性等特点优势的海洋环境数值预报系统方案。

具有高效应用性的曙光高性能计算集群系统

本方案采用了新一代曙光5000超级计算机,计算系统采用了20片双路刀片服务器(CB65-F)以及1台8路SMP计算节点(A950r-F),共提供288个处理核心,理论峰值运算速度高达2.5152Tflops(每秒2.5152万亿次浮点运算)。

曙光5000是国内首款面向百万亿次计算需求的超级计算机,是曙光公司于2008年6月推出的新一代IA架构高性能计算机系统,面向1-200Tflops级别超大规模高性能计算需求。能够很好的适应容量计算和能力计算需求,具备高性能、高效能、高密度、低能耗的特点,在多个层面达到了世界先进水平,目前已经被广泛应用于国防军队、航天航空、气象、制造业、教育科研等单位。

在本方案中,刀片间使用Infiniband高速模块,双向带宽达到40Gb,延时只有1.5μs。可大大提升系统的计算性能;针对应用环境的不同,曙光在存储部分采用了全光纤存储DS8314FF和半光纤的存储DS600-DF10,分别用来存放输入数据和生成数据,数据容量分别达到6.4TB和12TB。同时采用并行文件系统,保证了系统的高性能I/O。

而在计算节点方面,采用了高性能高稳定性的曙光刀片服务器TC2600(刀片CB65-F,双路AMD六核Istanbul处理器),并采用曙光八路服务器A950r-F作为SMP计算节点;I/O节点和登录、管理节点采用曙光天阔服务器A620r-H(双路AMD六核Istanbul处理器),计算和I/O网路采用Infiniband高速网路,监控、管理网路采用1000M网路。除了采用全局共享的大容量存储之外,单节点采用高性能的本地硬盘,以满足分布式I/O的需求。

值得一提的是,曙光TC2600刀片服务器模块化的设计整合了服务器、KVM、电源、网络及散热系统于统一的智能管理平台之上,紧密融合形成了高效的TC2600刀片服务器体系结构;不仅降低了高性能计算中心、数据中心对于空间的要求,只占7U机架空间的刀片机箱最多容纳10个刀片,仅需要传统解决方案70%的机架空间,而且大幅增加了计算密集性,与传统解决方案相比,同样的机架空间可以多提供42.8%的计算处理能力;在降低复杂度、简化使用和管理、降低总拥有成本的方面均得到了最大的优化。

总的来说,海洋环境数值预报系统方案不仅是硬件和系统软件的解决方案,同时也是应用层的解决方案。本方案不仅提供了气象业务系统运行所需要的开发环境、并行环境,并且能为用户调试好应用软件,能对应用软件进一步的调优,解决用户应用上的一些问题,使用户能够在新的机群系统上快速部署应用。

曙光高性能计算集群系统的特点与优势

高密度:曙光刀片服务器CB65-F的应用,在7U空间内可容纳120个计算核心,单个SMP计算节点提供48个计算核心。高密度代表着更高的性能,更小的空间,更低的管理维护成本,更低的总体运营成本。

高可用可靠性:每台刀片使用冗余电源,热插拔硬盘,服务器存储和磁盘阵列的存储系统使用数据保护的RAID,保证系统的稳定性和数据的稳定性。在登录/管理节点、存储节点采用了双机热备系统,增强了整个应用系统的可靠性。

可扩展性:所使用的曙光刀片TC2600平台,可以兼容曙光双路AMD刀片,双路Intel刀片和四路AMD刀片。整个机群系统可以实现无缝的扩展。存储采用FC SAN的存储结构,保障了性能和配置的灵活性,用户可以在这个的基础上对存储不断扩展。

低功耗:随着高性能计算机的发展,用户体会到每年的电费开支成为一笔不小的开支,该方案采用AMD的CPU及DDRII内存,比起Intel的CPU及FBD内存更加节省功耗。这为用户节约了运行成本,同时也符合现代IT设备的绿色环保的要求。

完善的服务:业内唯一的五年原厂商服务的企业,可帮助用户真正解决后顾之忧。一整套的解决方案,从前期的安装,培训,软件的编译、调优,以及设备到位后的培训,使用户不仅仅买到的是一些设备,而是能够真正用得好,能为自己的科研工作相助一臂之力的帮手。

国产高性能计算系统备受用户信任与肯定

近年来,曙光公司的发展日新月异,在科技的创新和突破是"更是一层楼"!随着曙光5000A的发布和使用,中国高性能产业的名气已经响彻全球业界。短短的十几年间,中国不仅成为全球第二个能自主制造百万亿次高性能计算机的国家,而且在2010年具有拥有完全自主知识产权的国产龙芯服务器也下线使用,国产龙芯服务器的应用将具有划时代的伟大意义。

江苏海洋监测预报中心表示,该系统方案的优点对于从事海洋环境的监测预报事业有着重大的影响和意义。无论是从数据准确性还是成本能耗方面考虑,曙光提供的此套方案均给与了完美的融合。这与他们当初选择曙光公司的原因不谋而合。

在曙光的配合下,江苏海洋监测预报中心的运行系统和监测预报记录得到了充分的效率保障,数据的准确性和可靠性以胜于过往的倍数在增长。这对于预测海洋环境的危机情况将起到有力的预测保障,对江苏省海洋事业的发展提供有力的支持。

犹如地震、海啸等也许不是人类所能阻止的自然灾害,但是在如今科技发达、经济水平高的社会背景下,人类的预知灾害的能力已经有所提高,因此在降低灾害的损失程度以及保障人类生命安全的能力上不再孤立无援。高性能计算系统的应用为国家稳定民心、稳定社会的发展提供了强有力的科技支持,为中国构建和谐社会有着不可估量的重大意义!

关于曙光:

公司是一家在科技部、信息产业部、中科院大力推动下,以国家"863"计划重大科研成果为基础组建的高新技术企业。它以中科院计算所、国家智能计算机研究开发中心和国家高性能计算机工程中心为技术依托,拥有强大的技术实力。曙光系列产品的问世,为推动我国高性能计算机的发展做出了不可磨灭的贡献。2008年6月,每秒运算233万亿次的首台国产百万亿次超级计算机曙光5000A研制成功,从而使中国成为继美国之后,第二个能研制百万亿次高性能计算机的国家。

2006年7月,占地面积60余亩的曙光天津产业基地落成投产,实现民族高性能计算机产业的历史跨越。曙光高性能计算机连续14年稳居国产高性能计算机市场第一,拥有国产高性能70%以上的份额,并在高性能集群领域实现了国产机对进口产品的超越。曙光公司生产的系列服务器以技术先进、性能卓越、服务优良见长,曾获"国家科技进步一等奖、二等奖"、"中科院科技创新特等奖"、"2001、2003、2004中国十大科技进展"等多项国家级殊荣。

长期以来,曙光始终专注于服务器领域的研发、生产与应用,依托超级计算机的扎实功底,立足自主研发,通过不断技术创新,构建出拥有完全自主知识产权的全系列精品服务器,能全面满足用户从超级计算机到普通PC服务器的各项应用需求,在互联网、金融、电信、生物、气象、石油、科研、电力等多个行业有着大量成功应用。