曙光助力苏州大学建设高效能计算机系统平台

教育乃民生之根本!中国作为正在迅速崛起的发展中国家,在教育领域国家给与了高度的关注和政策支持。随着信息化时代的来临,科技水平的提高,中国教育的方式也逐渐向教育信息化靠拢,教育信息化已经成为现代教育的主流。

高性能计算成为国内高校提升行业竞争力的重要手段

如今,随着我国在科技人才的培养和教育资源方面的深度投入,国内各大高校为了应对日益扩大的教育资源需求和满足高校对学科研究的强大计算需求现状,在国内高科技厂商的支持下,纷纷建立了以高性能计算为基础的高性能计算系统平台。一方面能够满足自身院校在科研、学科以及重要课题研究等方面的高端需求,另一方面在科学技术的助力下,将进一步扩大院校的科研水平和研究能力,进一步提升院校在教育行业的影响力和科技实力。

在国内知名服务器厂商曙光公司的助力下,国内院校包括清华大学、华东理工大学、华南师范大学等众多知名学府均已建立以提升教学质量和科研水平为目的的高性能计算系统平台,并获得了各大高校充分肯定,为高校在课题研究与教学提供了坚实的基础。

苏州大学作为国家"211工程"重点建设高校和江苏省属重点综合性大学,自建立以来,就以"第一家以西式教育方式办学、第一家创办学报、现存高校中最早开展研究生教育并授予硕士学位、第一家开设法学教育"等第一而闻名。如今,苏州大学已设有多个科研项目以及建立高性能计算与应用研究所,为我国社会相关领域的发展提供了重要的学术支撑。

然而随着研发力度的加大与科技研究项目的需求,原有的计算系统已无法满足当前的研究需求。同时,苏州大学高性能计算机系统目前运行着多个领域的应用软件。由于种类繁多、应用特点差异性大,对计算资源的需求更存在着巨大差别。因此,在此背景下,苏州大学需要续构建一个能满足其强大科研需求的高性能计算平台。为了保证该平台系统的成熟稳定、高可靠以及高性能特性,苏州大学选择了与在行业解决方案提供以及高性能平台建设经验丰富的曙光公司合作,欲通过曙光公司的行业经验来提升苏州大学的教学质量和整体的竞争实力。

经过反复的沟通,曙光公司根据苏州大学的特性与需求,为苏州大学提供了集先进性、兼容性、稳定性和完整性为一体的曙光5000计算集群系统方案。该方案由曙光5000高性能计算机群组成,采用开放的Cluster集群系统,能够满足现代高性能计算机对计算密度、能耗、可靠性、易用性等方面的要求,是目前高性能计算的最佳平台。

众所周知,曙光5000高效能计算机在体系结构、多处理机芯片组、高性能节点操作系统、高可扩展互连网络、高吞吐率通信软件、多线程分割全局地址空间编程模型及编译器等核心技术上均实现了较大突破。并在高效能计算机的高密度节点、可靠的系统结构、虚拟化软件、高效能海量存储、并行文件系统、大规模系统的管理软件、系统级鲁棒性技术、超大规模并行算法等产品及技术给予了充分的提供,为实现系统的高性能、可编程性、可移植性和稳定性奠定了基础!也为曙光所提供的相关解决方案满足用户多方面的需求提供了坚实的基础。

此次方案在计算刀片的选择上,曙光公司选择了第三代刀片TC2600系列中的CB85-F计算刀片四路服务器。该服务器在具有高稳定、高可用、高扩展、高密度、高性能等优质特点,其整体优化的策略和人性化设计、超强的系统扩展能力、卓越的性价比和计算密度,将有效降低系统功耗,可覆盖用户更广泛的需求。

该服务器采用7U/40PCS架构,共配置4个AMD Barcelona四核处理器,即每个刀片有16个处理核心。每刀片配置64GB内存, 1块160GB SATA硬盘,2个千兆以太网接口。其中,每个普通计算刀片可实现121.6Gflops浮点计算能力,每箱计算刀片服务器节点实现1216Gflops浮点计算能力。

曙光CB85-F刀片服务器

由于应用软件种类繁多,曙光公司为了使该高性能计算机系统保有较好的兼容性,选择了一向以配置兼容性良好而著称的Redhat AS Linux;同时为了满足高性能计算对存储的强大需求量,并保证系统的高性能和高可靠性,在存储系统方面,曙光选择了拥有高容量和高性能SAN存储系统。每台磁盘阵列通过4Gb端口连接到光纤交换机,每台IO节点都配置HBA卡,连接到光纤交换机。

软件管理则由曙光Gridview服务器综合管理系统v2.0组成,该管理系统采用模块化设计,能够提供机群部署恢复中心、综合监控管理系统、统一告警平台、统计报表系统、作业调度调度中间件、IPMI管理等多种机群管理功能。

曙光Gridview服务器综合管理系继承了曙光DCMM2、DCAS、曙光Gridview管理系统v1.1等监控管理产品的主要功能和技术特色,并增加多项优秀功能开发而成的机群监控管理系统产品。提供的统一集中式监控平台Portal,具备可扩展性、集成性、可靠性和易用性,能够满足同时对各不同厂家大型机的环境、硬件、软件等各方面进行监控管理的需求。

总的来说曙光5000高性能计算集群系统能够满足苏州大学庞大的计算需求,该方案集成并融合了计算系统、存储系统、网络系统、电源系统、散热系统、监控管理系统、KVM等模块于一身,通过管理模块的自动优化调节,能够达到最佳的运行状态,发挥出最优的整体性能。

目前,曙光5000高性能计算集群系统已经部署完毕并且投入正常的使用当中,正在为苏州大学的学科研究和课题研究带去精准、高效的计算支持,为苏州大学教学质量的提高和研究进度的推进起到了重要的作用。
曙光5000高性能计算集群系统的技术优势和特点

先进性

本系统采用使用高密度的刀片式集群系统,配合AMD的Barcelona四核处理器,整个系统的架构可以满足未来几年技术和应用发展的需要,使用时间长,可很好的保护用户的投资。曙光刀片系统TC2600是业界最先进的刀片服务器,具有更高密度、更好扩展性和更好可管理性优势,相比于其他系统,曙光集群刀片服务器具有更优秀的可扩展性。

完整性

该方案为用户提供了一个完整的、整体的解决方案。在系统基础硬件之上,配置了SKVM系统和集群管理软件、作业调度系统,使得各个子系统可以完好整合。完整性还体现在:硬件和系统的完整性,应用的完整性,、完整的培训和文档。

兼容性

一直以来,曙光公司的产品设计遵循开放的原则,从不设计技术壁垒。而本方案所采用的X86-64平台是应用最为广泛的,兼容性具有较好的保证。在运行64位应用的同时,还可以兼容32位的应用,普通的32位应用软件更可以不经过重新编译直接运行在这样的系统之下,用户可由32位平滑过渡到64位。

稳定性

长期以来,曙光高性能计算机具有较高的稳定性和可靠性,此优势特点受到了用户的广泛赞誉和有关部门的认可。该方案所采用的计算机产品均全部符合高稳定性、高可靠性、高兼容性等特点。
曙光高性能计算平台在教育领域的重要影响

随着中国高性能计算的不断发展以及社会经济水平的大幅度提高,我国各行各业在高性能计算技术的应用方面逐渐呈现出成熟化趋势,开放性的、高性价比的集群系统成为高性能计算机的主体架构,众多集群软件使得并行计算机的使用难度降低;高性能计算拥有大量的成熟的应用经验可以借鉴和汲取;高性能计算相关的人员队伍正在快速扩大……这些成就让中国高性能计算在传统应用领域的地位得到了进一步的巩固与提高。

曙光公司经过多年的行业耕耘与发展,已经成为中国各行业在构建高性能计算的专家。目前,曙光公司在中国教育领域已经取得了良好的口碑与好评。从长远来讲,曙光为中国教育实现与国际接轨的目标以及提升整体综合国力提供"入门式"的科技保障和坚实的科技基础!

关于曙光:

公司是一家在科技部、信息产业部、中科院大力推动下,以国家"863"计划重大科研成果为基础组建的高新技术企业。它以中科院计算所、国家智能计算机研究开发中心和国家高性能计算机工程中心为技术依托,拥有强大的技术实力。曙光系列产品的问世,为推动我国高性能计算机的发展做出了不可磨灭的贡献。2008年6月,国内每秒运算233万亿次的首台国产百万亿次超级计算机曙光5000A研制成功,位列全球第十。2010年6月, 曙光推出了国内首台超千万亿次的高性能计算机系统曙光星云,获得了第35届全球TOP500排行榜中第二名,创造了中国历年参选机器中的最好成绩。

2010年,曙光天津产业基地二期落成投产,不仅进一步提升了曙光公司企业的竞争力,更进一步推动了民族高性能计算机产业的发展。曙光高性能计算机连续15年稳居国产高性能计算机市场第一,拥有国产高性能70%以上的份额,并在高性能集群领域实现了国产机对进口产品的超越。曙光公司生产的系列服务器以技术先进、性能卓越、服务优良见长,曾获"国家科技进步一等奖、二等奖"、"中科院科技创新特等奖"、"2001、2003、2004中国十大科技进展"等多项国家级殊荣。

长期以来,曙光始终专注于服务器领域的研发、生产与应用,依托超级计算机的扎实功底,立足自主研发,通过不断技术创新,构建出拥有完全自主知识产权的全系列精品服务器,能全面满足用户从超级计算机到普通PC服务器的各项应用需求,在互联网、金融、电信、生物、气象、石油、科研、电力等多个行业有着大量成功应用。