北京市环境保护监测中心服务器集群案例

在生活中,很少的事物像我们呼吸的空气一样重要,而且没有一个人对大气污染产生的后果是免疫的,因此了解空气质量的级别至关重要。随着北京市经济的发展和人民群众生活水平的提高,市民环境意识逐步地增强,环境质量越来越受到人民的关注。北京市作为2008年奥运会的主办城市,空气质量要求尤为严格,北京市环境监测部门作为北京市环境保护系统的技术部门,是环境管理工作的重要基础。北京市环境保护检测中心为落实2008年绿色奥运的承诺和改善人民的生活环境,需要进一步改善北京市的空气质量,为此北京市环保检测中心利用世行资金,委托美国PA咨询公司和RTI研究所,开发北京市空气质量决策支持系统。
  
   北京市环境保护检测中心需要一个并行计算集群来运行北京市空气质量决策支持系统,空气质量决策支持系统内主要运行MM5气象模型和Model-3 (CMAQ)空气污染扩散模型。曙光公司全面分析了用户的实际需求,根据实际的用户需求,曙光公司制定出如下的方案设计原则:
  
  实际原则,从实际应用出发,遵照实际情况确定方案的选择与实施。
  
  先进原则,利用先进的计算机技术来建设一套完整的应用于科学计算的集群系统。
  
  经济原则,系统采用广泛应用且具有良好性能价格比的产品,既考虑节省投资,又保证产品的先进性和可用性。
  
  安全原则,系统应该受到严格的安全监控,保证系统的正常运行。
  
  扩展原则,系统支持动态扩展,在系统性能需要提升时,可以很方便地进行扩展。易管理原则,64个节点的机群服务器的管理必须非常简便,可以保证系统管理的有序性,高效性,避免管理上的混乱。
  
   依据以上设计原则,曙光公司设计出面向高性能计算的曙光TC4000集群系统方案。该集群系统由1个管理节点、4个计算节点、一套MYRINET网络、一套千兆以太网络、机柜系统、电源系统、SKVM系统、硬件监控系统以及其他附件组成。该集群系统通过四套网络(MYRINET计算网,千兆管理网, SKVM网。IIC监控网)将管理节点、计算节点以及控制设备和监控设备连接起来,组成了一个充满活力的集群系统,这个集群系统具备以下几个特点:
  
  管理节点和计算节点分开:能够充分利用计算节点的计算能力,将管理任务分配给管理节点大大地提高了计算节点的运算能力。
  
  千兆管理网络:千兆以太网的作用是在MYRINET网出现故障的时候仍然能够提供不间断的计算服务,并且千兆以太网还提供了绝大多数的管理功能
  
  SKVM网络:使得管理节点就像管理本地计算机一样轻松,并且这样的事情可以在几百米以外完成。
  
  管理监控网络:采用基于硬件采集的监控系统,不占用系统资源,做到主板级的监控。
  
  提供千兆外部连接,用户可以通过千兆网络连接到管理节点从而使用整个集群系统。
  
   曙光公司TC4000集群在北京市环境保护检测中心的成功应用显示了曙光在行业应用领域的领先地位。实际上,曙光公司一直致力于服务气象行业,特别是在国际型重大活动的举办中都有非常出色的发挥,同时在气象行业积累了丰富的行业经验。2001年,曙光服务器成功地服务了第21届大学生运动会。2002年曙光公司正式推出了专门面向气象研究的气象专用计算机,填补了国家空白,当年此类机型就应用于西藏和贵州省的气象服务,去年又进入了山西气象局等气象系统,开辟了一条科研和市场同步走的先河。作为引领IT潮流的曙光64位集群计算机,采用了国际领先的AMD OPTERON处理器,国内运行次数最高的每秒运算10万亿次的超级服务器曙光4000A也采用了同种系统结构。作为我国高性能计算领域的领头雁,曙光公司在“整合计算,细分应用”的指导思想下,已经在我国的气象、石油等关系到国计民生的重点行业中积累了丰富的行业应用经验,而随着浮点运算达到10万亿次的曙光4000A在上海超级计算中心投入运营,曙光高性能计算机在我国的现代化建设发挥愈来愈重要的作用。