曙光助中科院金属所构建高性能计算集群系统

根据中国科学院"十一五"信息化规划部署,围绕国家大科学装置科研院所和国家重点实验室所要开展科学研究的核心工作,结合沈阳地区材料计算模拟及振兴老工业基地等其他应用需求,中科院计划依托中国科学院金属研究所建设超级计算沈阳分中心,计划建设安装峰值性能为10万亿次的高性能计算机系统及配套应用软件。

随着信息化进程的推进与社会经济的发展,高性能计算应用成为社会各行业与各领域提升工作效率与强化竞争力的重要技术手段。中科院金属所作为我国高性能材料研究与发展的重要基地,长期以来以高性能金属材料、新型无机非金属材料和先进复合材料等为主要研究对象,面向国家战略需求和国家经济建设、面向世界科学发展前沿需要,有针对性地开展基础研究和应用研究,并注重科技成果的转化和产业化。

目前,中科院金属所的基础研究方面拥有沈阳材料科学国家(联合)实验室和金属腐蚀与防护国家重点实验室,其中沈阳材料科学国家(联合)实验室是我国第一个研究类国家实验室,应用研究方面拥有沈阳先进材料研究发展中心、材料环境腐蚀研究中心,工程化研究方面拥有高性能均质合金国家工程中心和国家金属腐蚀控制工程技术研究中心。因此所承载的研究任务以及计算需求十分庞大。

为了更好的响应中国科学院"十一五"的信息化规划部署以及满足金属所日后的发展需求,中科院金属所在曙光的助力下构建了一套能够具备高性能、高可用、高可靠、易管理特点的高性能计算解决方案。

在此之前,中科院金属所曾于去年购置过一套基于GPU的60个计算节点的HPC集群,部署在六个水冷机柜中。由于金属所机房的空间较为狭小,想在狭小空间内扩展上述规模的集群系统给方案设计以及后续的实施、部署都造成了较大难度。金属所广泛采用VASP、Gaussian等理化软件,该类软件属于计算、网络均密集型应用。经过多次交流,构建了一套基于40G的QDR网络、刀片式服务器以及机架式胖节点的集群环境,该集群达到了10万亿次浮点运算能力。

此次曙光为中科院金属所提供的解决方案具备高性能、高可用、高可靠、易管理特点,可支持今后不断更新和升级的需要。主要以曙光A840r-G服务器为计算节点,而计算系统则采用曙光TC3600刀片系统,能够满足金属所各方面的计算需求。在此方案中,曙光有效地与原有机房内设备融合,并全面提升机房利用率。该方案中同时配置了AMD和Intel平台的处理器。除此之外,还配置了胖节点服务器,多样的计算平台配置,满足了金属所多种应用需求,极大提升了该系统的可用性。

同时,本方案为了保障良好的可靠性,还配置了高速IB网络以及千兆以太网络。一旦IB网络出现故障,以太网络便可以升级为计算网络,继续提供计算服务,不仅降低了单一故障点,而且提升了系统可靠性。为了方便管理,曙光配置了强大的gridview的监管平台,管理人员可通过远程操作有效地对资源进行统一管理。

如今的高性能计算平台已经投入到日常运营当中,运营效果让用户十分满意。作为坚持"自主创新 服务中国"的民族厂商,曙光公司专业的技术能力与人性化服务获得市场用户的广泛认可。在2010年度中国高性能计算百强的排行榜中,曙光公司以34套高性能计算机再次独揽中国市场数量份额第一的冠军宝座。在不断发展与壮大的进程中,曙光公司长期坚持更新与研发更多符合市场需求与中国用户需求的服务器产品,力争将本土化的优势做到价值最大化,并助力推进中国信息化的发展进程。

关于曙光:

公司是一家在科技部、信息产业部、中科院大力推动下,以国家"863"计划重大科研成果为基础组建的高新技术企业。它以中科院计算所、国家智能计算机研究开发中心和国家高性能计算机工程中心为技术依托,拥有强大的技术实力。曙光系列产品的问世,为推动我国高性能计算机的发展做出了不可磨灭的贡献。2010年6月, 曙光推出了国内首台超千万亿次的高性能计算机系统曙光星云,获得了第35届全球TOP500排行榜中第二名,创造了中国历年参选机器中的最好成绩。

2010年,曙光天津产业基地二期落成投产,不仅进一步提升了曙光公司企业的竞争力,更进一步推动了民族高性能计算机产业的发展。曙光高性能计算机连续15年稳居国产高性能计算机市场第一,拥有国产高性能70%以上的份额,并在高性能集群领域实现了国产机对进口产品的超越。曙光公司生产的系列服务器以技术先进、性能卓越、服务优良见长,曾获"国家科技进步一等奖、二等奖"、"中科院科技创新特等奖"、"2001、2003、2004中国十大科技进展"等多项国家级殊荣。

长期以来,曙光始终专注于服务器领域的研发、生产与应用,依托超级计算机的扎实功底,立足自主研发,通过不断技术创新,构建出拥有完全自主知识产权的全系列精品服务器,能全面满足用户从超级计算机到普通PC服务器的各项应用需求,在互联网、金融、电信、生物、气象、石油、科研、电力等多个行业有着大量成功应用。