在信息经济时代,计算技术已经成为先进生产力发展的标志之一。在这种先进生产力中,高性能计算更是具有代表性。目前,计算科学(尤其是高性能计算)已经与理论研究、实验科学相并列,成为现代科学的三大支柱之一。高性能计算作为一种先进的科研手段,在国内的应用发展很快。尤其是近年来,国家在重点高校的教育、科研方面的高性能计算平台建设上的投入逐年加大。
高性能计算技术成为高校增强竞争力的重要手段
随着高校数字化校园建设的深入,高性能计算机的应用已经渗入到各级教育行业当中。构建高性能计算平台已经成为各大高校提高教育质量的重要手段。而随着用户不断增加,海量信息处理、信息开发和科学研究对高性能计算服务的需求越来越高。
某华东"国家985工程"高校作为国内知名的高等学府,其设有的研究基地和研究项目为国家的发展做出了巨大的贡献。2006年在曙光公司的帮助下,高校已经建有高性能计算集群系统,原有系统由32台曙光4380A计算节点+登录节点+管理节点+IO节点+ 存储系统Myrinet高速计算网络构成。该系统部署后至今使用情况稳定,具有高利用率,低故障率等特点,保证了学校所有用户的正常使用,顺利的协助用户完成相关的科研工作。
但是随着社会的发展和研究项目的需求,原有的这套系统已经无法满足庞大的研究需求,所以该校急需在原有的系统之上建设更为成熟、更具高标准的系统平台。以满足材料设计、催化剂设计、药物设计、计算生物学、流体与固体力学计算等领域的科学研究。
曙光为高校构建高效能计算机集群系统
曙光公司作为服务器行业的领军者,服务器资源有着得天独厚的优势。近年来,曙光公司为国内众多高校构建了众多具有高标准、高水平、高性能的系统平台,能够满足不同高校多不同研究领域的计算需求。曙光为某华东高校构建了全新的计算平台,曙光服务器所构建而成的系统在高性能计算方面的突出成就,令人满意。
本系统采用曙光天潮系列高效能计算机架构来构建,采用CPU+GPU的混合架构,由7个机柜组成,用来安装GPU专用机和曙光A840r-G计算节点,管理、登录、I/O节点、高速交换机、存储等设备。
曙光天潮高效能计算机力求在体系结构、多处理机芯片组、高性能节点操作系统、高可扩展互连网络、高吞吐率通信软件、多线程分割全局地址空间编程模型及编译器等核心技术上实现较大突破;并提供高效能计算机的高密度节点、可靠的系统结构、虚拟化软件、高效能海量存储、并行文件系统、大规模系统的管理软件、系统级鲁棒性技术、超大规模并行算法等产品及技术,从而实现系统的高性能、可编程性、可移植性和稳定性。
本方案最大的特点是采用了全新的曙光四路服务器A840r-G作为计算节点,其所采用的AMD 最新一代8核或12 核Magny?Cours 处理器,同前代产品相比,进行各各项重大改进,A840r-G可最大支持48 个处理核心;A840r?G 服务器采用了AMD SR5690 系列高性能服务器芯片组,为用户的各项应用提供更高的性能。同时,还支持先进的四通道DDR3 1333/1066 MHZ ECC 高性能内存,内存容量最大可达512GB,而且为用户提供灵活且强大的内存的配置选择;此外,A840r-G服务器提供强大的虚拟化能力,AMD?V技术提供硬件IO 虚拟化支持,结合支持虚拟化的曙光高性能网卡技术,将强大的A840r-G服务器虚拟成多个机器,可极大地提高整机性能和运行效率。
曙光A840r-G服务器的配备,更将其拥有的高稳定性、强大计算性能、良好扩展能力、高可靠性、高可管理性以及节能减耗的优势应用到系统提升计算性能的技术需求当中,为该系统的节能减排以及提高计算性能提供了重要的技术保障。
在计算系统方面,曙光公司采用了开放的Cluster集群系统,它拥有的独特优势已经占据了目前高性能计算机的主流位置,在TOP500中占据了80%以上的份额,在中小规模的高性能计算系统中更是占据统治地位。
同时,本方案的网络系统的设计也从性能和可靠两个原则出发,采用2套网络。网络配置都考虑了扩展余量,以便系统扩充。该方案设计充分考虑到了计算节点、存储节点、网络交换机的性能参数,在保证了系统稳定的前提下,使每台设备都能得到最大限度的利用。
存储系统采用曙光新一代Gridview大型机综合管理系统来提供统一的集中式监控平台,具备可扩展性、集成性、可靠性和易用性等特点。
曙光高效能计算机集群系统的优势
先进性
本系统采用先进而成熟的技术和产品,适应大规模科学计算及数据处理的需要,所选设备指标应具有适度超前性,使整个系统具有较强的生命力,并具有更高的密度、更好的扩展性和更好的可管理性;
完整性
本方案为用户提供了一个完整的、整体的解决方案。在系统基础硬件之上,配置了SKVM系统和集群管理软件、作业调度系统,使得各个子系统可以完好整合。完整性还体现在:
硬件和系统的完整性:
本方案是一个完整的解决方案,用户无需增加额外的硬件和软件即可保证系统中所有设备正常运转。
应用的完整性:
本方案不仅是硬件和系统软件的解决方案,同时也是应用层的解决方案。
完整的培训和文档:
曙光公司不仅让用户能够使用机器,而且还让用户能够用好机器。为此本方案提供了一系列的培训,培训课程分别针对不同的人员,包括:普通用户、系统管理人员、开发人员;培训的内容包括从集群的简单使用到并行软件的研制和并行算法的设计、从系统的管理和日常维护到设备的原理等一应俱全;训的教师也包括一线经验丰富的技术工程师和长期从事科学研究的中科院计算所的专家。在有完备的培训的同时,又为用户提供了完备文档。
兼容性
本方案采用了应用最广泛的X86-64平台,兼容性有了更好的保证。可以运行64位应用的同时,还可以兼容32位的应用,普通的32位应用软件可以不经过重新编译直接运行在这样的系统之下。这样,用户就可以由32位平滑的过渡到64位。
稳定性
曙光高性能计算机具有较高的稳定性和可靠性,受到了用户的广泛赞誉和有关部门的认可。
曙光公司为某高校量身定制的解决方案得到了用户的高度认可,能够有效的满足某高校的研究以及计算需求。曙光公司作为国产服务器市场的领军队伍,历年来为用户提供了大量的行之有效的解决方案,曙光的产品技术均达到用户对于大规模系统建设的需求。
此次为该国家重点高校构建的曙光集群系统平台为该校之后的课题研究、项目研究提供了重要的技术保障。在实现简约管理的同时,大大减少了用户的后期维护和管理成本。相信在曙光公司的助力下,该校将为我国的科学研究以及人才培养能够做出更大的贡献。
关于曙光:
公司是一家在科技部、信息产业部、中科院大力推动下,以国家"863"计划重大科研成果为基础组建的高新技术企业。它以中科院计算所、国家智能计算机研究开发中心和国家高性能计算机工程中心为技术依托,拥有强大的技术实力。曙光系列产品的问世,为推动我国高性能计算机的发展做出了不可磨灭的贡献。2010年6月, 曙光推出了国内首台超千万亿次的高性能计算机系统曙光星云,获得了第35届全球TOP500排行榜中第二名,创造了中国历年参选机器中的最好成绩。
2010年,曙光天津产业基地二期落成投产,不仅进一步提升了曙光公司企业的竞争力,更进一步推动了民族高性能计算机产业的发展。曙光高性能计算机连续15年稳居国产高性能计算机市场第一,拥有国产高性能70%以上的份额,并在高性能集群领域实现了国产机对进口产品的超越。曙光公司生产的系列服务器以技术先进、性能卓越、服务优良见长,曾获"国家科技进步一等奖、二等奖"、"中科院科技创新特等奖"、"2001、2003、2004中国十大科技进展"等多项国家级殊荣。
长期以来,曙光始终专注于服务器领域的研发、生产与应用,依托超级计算机的扎实功底,立足自主研发,通过不断技术创新,构建出拥有完全自主知识产权的全系列精品服务器,能全面满足用户从超级计算机到普通PC服务器的各项应用需求,在互联网、金融、电信、生物、气象、石油、科研、电力等多个行业有着大量成功应用。