近日,在国家高性能计算中心(合肥)的高性能计算机采购招标中,曙光TC4000高性能机群服务器凭借出色的性能和稳定性,成功中标,为我国首个国家高性能计算中心的科研探索提速做出贡献。
在整个系统平台搭建中,曙光工程师将已经在高性能计算领域成熟应用的曙光TC4000机群与用户实际需求相结合,为国家高性能计算中心(合肥)量身打造了具有超强运算能力、性能稳定可靠、性价比合理并且具备良好可扩展性的整体解决方案。
据悉,在本次高性能计算平台的搭建时,国家高性能计算中心(合肥)要求机群服务器必须满足高性能、高稳定性、低投入以及持久发展的目标。在严谨、慎重的考量后,该项目负责人认为,曙光公司所提供的TC4000机群是最佳解决方案,TC4000机群有着成熟的大规模机群体系结构,并配以创新的产品技术,而且每个创新部件都有成熟的产品部件与之对应,在产品创新和可靠性上有着最优的平衡配置,同时保证应用饱和性能的稳定。
国家高性能计算中心(合肥),座落在我国著名的学府-中国科学技术大学西区校园内。它是我国五个国家级高性能计算中心之一(合肥、武汉、成都、上海、北京),作为我国第一个国家高性能计算中心,它成立以来,先后承担了国家973、国家863、国家自然科学基金、国家攀登计划、国家发改委、国家博士点基金等20多个国家部委级纵向项目。
国家高性能计算中心(合肥)隶属于省科技厅、中国科技大学和中科院合肥物质科学研究院。十年来,它将高性能计算的理论与方法应用于淮河流域的防洪、防污和水环境的治理,产生了显著的社会和经济效益,其中"安徽省防灾减灾智能信息与决策支持系统"曾获2001年度国家科技进步二等奖。中心主任陈国良教授也因其在并行算法和高性能计算及其应用领域做出突出贡献而光荣当选为中国科学院院士。
近年来,随着安徽地方经济的发展和学校科研实力的增强,中心对高性能计算提出了更高的需求,各种高端科研活动均要求有强大的高性能计算机作为支撑。为了进一步提升其科研实力,院方决定向全国招标采购高性能计算机系统,并最终选择了曙光天潮TC4000高性能机群服务器。
曙光TC4000高性能计算机是国家863计划高性能计算机及其核心软件重大专项支持的研究项目,是面向网格的高性能计算机,可以为网格提供计算服务,同时也是面向信息服务的超级服务器,可以提供多目标的系统服务。曙光TC4000高性能集群系统包括计算节点、管理登录节点、I/O节点、内/外置I/O系统、系统运行监控网、视频切换网、系统管理及服务网和其他机群辅助构件。所有服务节点都选用可扩展性强,性能稳定的曙光Xeon/Opteron系列机架式节点,配置可根据应用负载和投资大小,对节点性能进行增删和服务调配。
据曙光研发人员介绍,曙光TC4000集群服务器系统解决方案独具有六大优势,成为此次成功中标的主要因素:
一、系统整合:曙光TC4000集群服务器涵盖服务器节点、机柜系统、电源系统、网络系统、监控系统、控制平台以及服务器的周边系统(包括服务器、存储和网络等)。对于用户来说,曙光TC4000就像一台大的机器,只需要一个总的电源和网络入口。各个子系统都有专门设计,比如机柜系统支持多机柜并柜设计,电源系统实现分时上电、可支持三相电或二相电接入等。
二、监控管理:曙光TC4000系统利用简单直观的管理工具来管理整个集群,使得系统管理员可以从多台服务器重复、单调的管理工作中解放出来,极大地提高了工作效率。通过曙光TC4000集群主机柜的液晶触摸屏可以监控到整个集群的软硬件运行状态,如:整个系统工作环境,各节点CPU和内存的使用率,网络流量,各节点主板温度、CPU温度,机箱风扇转速、CPU风扇转速,主板电压、CPU电压等等,使系统管理员对各节点的情况一目了然。监控工具同时提供了报警功能,当出现故障点时(如温度异常、风扇停止转动等),可以及时提醒系统管理员进行处理,避免或减少系统故障和由其引起的用户损失。
三、远程操作管理:曙光SKVM II系统不同于普通KVM系统,它不仅可以实现99个节点的视频控制,可以将终端拉到距离节点机100米以外的地方对整个机群系统进行完全类似于本地操作的控制;另外曙光SKVM II通过高性能的TCP/IP网络连接,通过局域网、广域网或拨号上网对服务器进行远程操作,并可根据不同的网络条件设置设备占用带宽,远程操作与服务器操作系统无关。其方便的切换功能使得系统管理员在管理整个机群的时候非常方便。
四、远程监控、开关机:曙光TC4000 DCMM2不仅提供对机群节点的软/硬监控信息的实时显示,而且提供一些设备如交换机、盘阵的实时信息监控,并实时报警。DCMM2使用了数据库存储监控的信息,提供历史数据分析和查询。它还提供远程监控功能,可以远程监控机群的资源信息。DCMM2监控系统可以通过远程监控界面,对该管理节点下的节点机进行开关机控制,包括单独操作,批量操作等。
五、动态扩展:曙光TC4000的集群式架构决定了其具有优异的动态扩展性。根据用户应用需要,可以选择扩展能力很强的通用节点,节点总数可扩展到1000多个。尤其需要指出的是,TC4000的动态伸缩性非常强。用户如果需要减少节点数目,可以随时指定节点与整个系统隔离;用户如果需要扩展节点,只需稍微变更配置文件即可完成。系统更可以支持扩展不同操作系统和硬件平台的节点,全方位满足用户未来应用扩充的需求。
六、5年免费上门服务:曙光提供的五年全免费上门服务,这5年时间内,曙光服务器出现的任何问题用户不需要过多操心,曙光公司工程师接到报修后会迅速带齐相关配件上门为用户解决问题,这样一来就能够为用户节约大量的维护成本费用,更能让用户省心省力。最重要的是,曙光公司提供的是本地化的服务,不管是响应的时间,人员的安排,备件的到达以及免费服务的质量,等等方面都属于服务器行业的翘楚。
作为国产服务器行业的领军企业,曙光在高端服务器研制方面,以中科院计算所、国家智能计算机研究开发中心和国家高性能计算机工程中心为技术依托,一直走在行业和世界的前列。其高性能计算机连续12年稳居国产高性能计算机市场第一,拥有国产高性能机70%以上的份额,并在高性能集群领域实现了国产机对进口产品的超越。2007年中国高性能计算机性能TOP100排行榜中,曙光位列三甲,继续率领国内厂商在高性能计算机市场和高新技术领域开疆扩土。2008年,峰值运算能力达到100万亿次/秒以上的曙光5000也将问世,研制成功之后,中国将会成为继美国之后第二个能够生产百万亿次超级计算机的国家。
迄今为止,曙光TC4000超级计算机已经成功应用于生物信息学、计算化学、气象等几十个高性能计算领域,交付使用了近千套产品,有力地支持了我国教育、科研、生产等在高性能计算领域的快速发展。此次曙光TC4000计算机群的成功中标国家高性能计算中心(合肥),将为该中心的高端科研运算再添筹码,进一步提升该中心的科研工作效率和在高性能计算领域的综合实力。同时,该项目的实施也进一步展示了曙光服务器在高性能计算领域的整体实力,体现了曙光公司所具备的超强系统整合能力,为用户选择曙光高性能机群产品提供了更好的参考。