曙光助力中科院动物所构建HPC解决方案

生命科学作为21世纪最重要的科学分支之一,已经成为各国竞相探讨与研究的热点学科对象。伴随着测序技术的飞速发展,人类所发现的基因序列数目按照指数级增长,随之产生的即是数量庞大的基因,需要我们进行同源性搜寻,比对、分析、遗传发育分析等等,而此些程序随即产生巨大的数据处理量和并行计算量。

曙光5000高性能计算系统强大的计算性能、缜密的技术处理等优势成为此些领域的"得力助手",尤其是作为曙光5000核心计算节点的CB85-F刀片服务器,其超群的高性能、高扩展力以及降低系统功耗的优势尤受广大用户青睐,备受好评。如今,以曙光为代表的高性能计算在生命科学的研究和发展中起着非常重要的作用。

社会发展引发高性能计算应用潮流

近年来,随着科学技术的飞速发展,中国在生命科学研究领域亦投入了巨大的研究精力与资金,尤其是在高校、研究所等重要科学领域基地的研究。

由于生命科学的研究对象往往是蛋白质和DNA的大分子,因此其所涉及的大都是精密且准确度要求极高的高端分析。而高性能计算强大的计算性能和准确的数据分析等专业高端技术,能够满足这些科学问题的研究与发展,可为支撑此些项目继续发展与运行提供重要保障。

伴随着研究范围的扩大与学科分析的深入,可通过高速网络将多个超级计算节点的计算能力汇聚到一起,并支持大规模并行计算任务的集群架构成为各大研究机构的热门选择,成为业界流行的标准选择。其中,基于曙光CB85-F四路刀片构建高性能计算集群系统,具备完整的体系架构、高效的计算节点配置、多元化的软硬件设备在性能和专业应用上满足了科研需求,同时曙光公司完整的售后服务方案让用户在使用过程中减少了维护与使用的忧虑。

系统升级成为应对强大计算需求的有效手段

伴随着研究的深入,越来越多的机构原有的计算设备已经无法满足现有应用的计算需求。中科院动物研究所原有一套30节点的刀片式服务器集群,主要用于生命科学中序列比对的研究。但是研究的深入,让现有的设备无法满足当前的计算需求,因此,迫切需要增加一套集群设备,构建强大的高性能计算平台或者是升级当前的设备成为当务之急。

曙光公司针对动物所的实际情况,经过专家团队的考察与衡量之后,最终为动物所提供了一套"经济"的解决方案。不仅能够保证原有集群设备的有效使用,而且能够实现用户对新旧集群均应部署于生科院动物所现有的机房中的要求。此次系统扩容除了能扩大集群系统的计算能力,还能扩大集群的使用功能,实现了完成序列比对应用之外的其他应用。

该计算平台的核心硬件系统采用集群架构,主要包括高性能计算节点、I/O系统、容错模块等几个部分。

可看出,用户原有的30节点刀片计算集群得到了有效的扩容。扩容后的集群新增了CB85-F四路高性能刀片节点,与原有集群共同构建一套大规模的计算平台,同时新增集群中配置一台线速无阻塞的Force10 千兆以太网络用作数据交换。而为了保证计算平台的可靠性,该集群系统还增加了一个冗错机,可以进行作业中间状态的保护,大大提升集群系统的可用性。

关键技术点 提升系统整体竞争力

本方案方案采用享誉业界的新型"超并行"体系结构,不仅是中国自主知识产权产品,并且充分发挥出计算节点CB85-F的优势,获得了高性能、高效率、高密度、高性价比、低功耗以及广泛适用等特点。

关键计算节点:该系统的计算节点以CB85-F为主,多达40多个的数量为曙光5000提供了640个2.1GHz处理器核心,理论峰值运算速度高达5.38Tflops(每秒5.38万亿次浮点运算),具备超强的计算能力。作为曙光最新研发的新一代刀片式服务器产品,CB85-F是专为HPC进行优化设计的产品,其单结点linpack效率超过85%。特有的四颗处理器通过AMD Hypertransport总线直接实现互联,互联带宽高达8GB/s。同时,每个处理器通过集成的内存控制器访问四通道内存系统,能够极大的满足动物所的运算需求。

体系架构:本方案采用的高性能计算机系统基于业界流行的集群架构,通过高速网络将多个超级计算节点的计算能力汇聚到一起,可以支持大规模并行计算任务。

管理软件系统:提供商业的Gridveiw2.0大型机综合监控管理软件,支持资源监控、系统管理、综合告警、智能报表以及作业调度,可以实现对系统软硬件资源的统一管理。

可选水冷机柜或风冷机柜两种散热方案:曙光为本方案配置了天潮机柜系统(风冷方案),采用业内领先的铝镁合金整体型材结构设计,具有强度高、重量轻、可靠性高以及模块化、拆装便捷等特点;曙光水冷机柜系统(水冷方案)采用水作为冷媒,由外部水冷机组提供冷却水经由管道输送到机柜内的热交换设备,冷却水在热交换设备内与服务器产生的热空气进行高效率的热交换,可以有效解决大功率高密度服务器所产生的热量。

网络方案灵活:曙光5000可以根据客户的应用需求选配不同的网络,既可以使用全无阻塞的Infiniband CLOS网络构建计算存储网络,也可以使用冗余万兆级联的分区无阻塞Ethernet互联网络和FC SAN网络构建计算存储网络;

存储系统方案多样:本方案可以根据应用需要配置存储系统,既可以配置简单易用的DAS存储,又可以构建高性能的FC或Infiniband SAN存储,提供较高的聚合I/O带宽。

曙光高性能计算集群 开启中国行业应用未来

随着社会的发展和行业的不断壮大,高性能集群已经成为社会发展与各行业应用的重要趋势,亦是中国高性能应用行业得到跨越的重要体现。随着科技水平的提升,各个行业对于科学化、信息化的需求显著提升,具备更高性能技术的服务器系统设备成为满足信息化需求的重要手段。

此次曙光公司为动物所配置的高性能计算集群系统平台具备高性价比、开放性,兼容性、易扩展,扩展成本低、易管理使用;整体拥有成本低、使用灵活,尤其适合用户计算中心用户等众多优势特性,能够满足动物所日后的扩容需求与运算需求。

曙光公司作为国内知名的服务器厂商,在高性能计算应用领域具备权威性的应用路程,其旗下的系列优质服务器产品能够满足用户从超级计算机到普通PC服务器的各项应用需求,在全国范围内拥有极高的应用覆盖率。

或许在不远的将来,曙光高性能计算集群系统将成为引领中国除高端领域之外的普及应用,让真正的高性能科技融入到人们的日常生活当中,全面开启高性能计算高端技术的应用未来。

关于曙光:

公司是一家在科技部、信息产业部、中科院大力推动下,以国家"863"计划重大科研成果为基础组建的高新技术企业。它以中科院计算所、国家智能计算机研究开发中心和国家高性能计算机工程中心为技术依托,拥有强大的技术实力。曙光系列产品的问世,为推动我国高性能计算机的发展做出了不可磨灭的贡献。2010年6月, 曙光推出了国内首台超千万亿次的高性能计算机系统曙光星云,获得了第35届全球TOP500排行榜中第二名,创造了中国历年参选机器中的最好成绩。

2010年,曙光天津产业基地二期落成投产,不仅进一步提升了曙光公司企业的竞争力,更进一步推动了民族高性能计算机产业的发展。曙光高性能计算机连续15年稳居国产高性能计算机市场第一,拥有国产高性能70%以上的份额,并在高性能集群领域实现了国产机对进口产品的超越。曙光公司生产的系列服务器以技术先进、性能卓越、服务优良见长,曾获"国家科技进步一等奖、二等奖"、"中科院科技创新特等奖"、"2001、2003、2004中国十大科技进展"等多项国家级殊荣。

长期以来,曙光始终专注于服务器领域的研发、生产与应用,依托超级计算机的扎实功底,立足自主研发,通过不断技术创新,构建出拥有完全自主知识产权的全系列精品服务器,能全面满足用户从超级计算机到普通PC服务器的各项应用需求,在互联网、金融、电信、生物、气象、石油、科研、电力等多个行业有着大量成功应用。