没有人否认,分布式集群技术让高性能计算在不断突破峰值纪录的同时,迅速走向普通大众,上世纪80-90年代还是巴统组织的禁运技术,现在已经高校、科研等领域的普通生产工具。因而有人认为,既然集群技术能够以scale out的方式,用低性能设备累加出高性能表现,那么scale up的大型服务器已经没有用武之地。但是事实真是这样吗? 重卡之于轻卡 集群技术的思想很简单,就是用 “N台轻型卡车协同完成一台重卡的运载任务”。但是10台轻卡并不等于一台重卡,现实中有许多无法分割的大型货物离不开重卡,同样,高性能计算中也有很多计算任务,不能有效分布并行化,而离不开高扩展、高性能的大服务器,这些服务器在高性能计算中被称为胖节点。当前高性能的胖节点有比例不断增大的趋势,这主要源于Open-MP计算程序的广泛应用,以及胖节点在完成大型计算任务时的优势。 大型服务器在高性能计算应用中与中低端服务器的关键区别就是多处理器(8颗以上)共享大容量内存(通常为4路及以下服务器的2倍以上)在进行大模型计算时,大内存允许中间数据存储在内存中,而不需要和硬盘交换数据,可以减少I/O频度,明显提高计算速度。有时I/O问题是大问题求解的杀手,因此从技术上看,大型服务器设备具有更大优势。但是,真正导致高性能计算离不开大服务器的,是广泛应用的Open-MP程序。 大服务器与Open-MP 基于Open-MP开发编译的应用在CAE、计算化学、生命科学、石油勘探、环境科学等行业领域随处可见。Open-MP是一个共享存储方式的并行编程标准,它采用“制导语句”的方式实现,即在原有的串行程序中插入一些指导并行的语句,因此,Open-MP非常适合将原有的串行程序改造为并行程序。当前GCC、Intel、PGI、MS VS.net等主流编译工具均提供对Open-MP的支持。但是Open-MP只适用于硬件共享存储的计算设备,如多核芯片、多处理器节点等,而不能跨节点运行,因此Open-MP程序离不开多处理器共享容量大内存的大型服务器。 浪潮TS850,理想的胖节点 2010年,浪潮推出了第一款中国自主设计的八路服务器TS850,为Open-MP程序和大模型计算做了大量的专门设计,作为胖节点可以在性能、内存方面极好地满足实际应用需求。相比四路胖节点,TS850具有更多CPU核心,最大支持80处理器核心,160个线程;更大的共享内存,最大支持2TB内存。同时胖节点TS850在设计上完全按照高端需求设计,支持20余项RAS特性,在可靠性、可扩展性、可管理性和可用性方面具有优异表现。现在HPC遇到的问题是,随着系统规模扩大,出故障的概率就会增大。而系统本身的平均无故障时间越长,系统越可靠,做容错和高可用的代价就会越小。TS850在承载重任的同时,还能有效降低用户总体成本。目前,该产品已经在天河一号工程、山东大学等多个大型高性能平台成功应用,下面简单介绍该产品在不同应用领域的解决方案和具体表现。 CAE CAE即计算机辅助工程设计,在航空、航天、能源动力等工业领域有着广泛应用,CAE大计算量的特点决定了需要大容量内存。对大内存的支持让CAE在前后处理方面获得自由,使其在大模型的建立、大图形的处理以及大数据库的操作方面几乎没有障碍,用户可以建立高保真模型。
对于CAE类的应用,比如Ansys和ABAQUS,在某些网格数目巨大,并且网格划分负载不平衡的情况下,采用MPI的效果非常差,必须采用Open-MP才能达到良好效果,并且对于这些隐式有限元分析软件,其本身算法决定了扩展性不会太好,单机计算能力才是重中之重。 中国科技大学的CAE领域科研计算工作面临着通用节点无法提供大容量共享内存,一些大模型的计算小节点无法完成,多节点使用并行效率又很低,每次模型的修改都会浪费大量时间。浪潮HPC综合解决方案中胖节点选用高端八路服务器TS850为中国科技大学化解了此项难题。浪潮TS850采用共享大内存并行系统架构,能够提供相足够的共享内存来运行此类程序,提高程序的运行效率。 计算化学 计算化学是理论化学的一个分支,主要目标是利用有效的数学近似以及电脑程序计算分子的性质用以解释一些具体的化学问题。对于计算化学类的应用,比如Gaussian、VASP,随着计算规模的扩大,内存需求会随基函数数量的平方而增加,特别是对于Gaussian而言,其支持Open-MP和TPC-Linda两种并行方式,前者的并行效率要远远高于后者,另外Gaussian在选择MP2计算方法时,会产生大量临时文件常驻内存,因此更适合在一台大内存高计算能力的胖节点上做大型Gaussian的计算任务。
山东大学在计算化学领域具备较强的实力,实力的背后离不开高性能的计算平台。该计算平台由浪潮承建,胖节点选用TS850,无论从性能方面,还是在内存方面都具备领先优势,这也是该解决方案最大的亮点。该方案也应用在了安徽大学计算化学领域的高性能计算。浪潮高性能解决方案借助胖节点浪潮TS850的共享大内存并行系统架构,能够提供足够的共享内存来运行Open-MP程序,提高程序的运行效率。 生命科学 随着基因组学的快速发展,其产生的海量数据对存储、计算机性能等方面以每12-18个月10倍的速度在增长,并已远超越著名的摩尔定律。基因序列拼接是一个巨大数据量的处理过程,对CPU的频率、内存都有十分苛刻的要求。传统四路服务器在运行该类软件Phrap,效率非常低,耗费大量宝贵时间。TS850八路胖节点利用多线程技术加速其中具有并行性的部分,对Phrap程序的SMP机器并行版本有极佳的支持,获得更好的时间效率。
中科院生物物理所作为我国顶尖的生命科学基础研究所,对于高性能计算平台有着极其苛刻的要求,浪潮凭借基于智能胖节点TS850的高性能解决方案在众多方案中脱颖而出。浪潮TS850凭借其超大核心数和大容量内存,以及优异的并行性能最大限度地提升基因序列拼接软件的效率。 “好用、用好” 以上是选取CAE领域、计算化学、生命科学三个行业进行的详尽解读,由于篇幅所限,其他石油勘探、环境科学等行业不再进行解读。 浪潮高性能的业务理念是“好用用好”,即“只有通用的平台,没有通用的应用”,提供定制化的方案,让平台“好用”,并通过全程的技术服务,让客户“用好”。用户在搭建高性能系统,应用、成本、管理、效率等多种因素需要综合考量。不可否认,一些平台往往从成本考量,采用四路服务器做胖节点,但是采购成本仅占高性能平台的全生命周期成本的一半不到,八路服务器的性能、效率等优势会在整个生命周期中显现出来,提供更好的总体成本,因此,我们还是推荐客户采用八路大型服务器,特别是运行Open-MP程序和大型任务的平台。 |