曙光助力中石化构建GPU机群系统解决方案

众所周知,GPU拥有数十倍于CPU的浮点运算能力。多年前就已经在CAD、动画制作以及3D图形设计等拥有复杂计算需求的领域得到有效应用。而随着GPU计算技术的不断成熟和国内单位研究成果的扩大化,以GPU强大计算能力为基础的系统平台也成为我国相关领域(拥有复杂计算需求)关注与应用的焦点。

近年来,随着GPU计算模式的兴起,GPU计算模式强大的优势逐渐得到体现,其应用规模与广阔度也得到了相应的拓展。时至今日,GPU已发展成为一种高度并行化、多线程、多核的处理器,具有杰出的计算功率和极高的存储器带宽。

中石化物探技术研究院是我国主要从事地球物理相关研究工作的专业研究院,在长期的发展中,中石化物探技术研究院也致力于自主研发适用于自身领域的软件产品,其生产的icluster处理软件已经成功应用在多个生产单位中。但是随着生产规模的扩大,对地震资料处理系统的性能要求越来越高。在传统模式下,通过增加CPU个数和核数在一定程度上可以提升处理系统的性能,但随着内存墙和散热的瓶颈,CPU性能的提升出现了较大的阻碍与难度。

因此,中石化物探技术研究院为了满足日益发展的需求,在国内知名解决方案供应商曙光公司的助力下欲构建一套高性能的GPU集群处理平台,希望能够将现有的处理软件有条件的移植至该平台,进而拓宽软件的发展道路。

为中石化研究院搭建高性能计算平台的是我国高性能计算领导厂商曙光,经过详细的分析与规划,曙光公司为中石化研究院提供了一套以曙光天阔W580r-I服务器为核心计算节点、由千兆以太网组成高度适应性网络系统的GPU高性能计算系统。

曙光介绍,该方案主要是在中石化原有的系统基础上加以完善,采用曙光W580r-I服务器主要是基于曙光天阔W580r-I服务器具有处理速度快、扩展性强、易管理和低噪音等特点。作为曙光精心打造的一款性能卓越,稳定可靠,配置灵活的新一代双路服务器产品,曙光W580r-I所采用的双芯片组设计,能够保证系统超强的专业显卡扩展能力。而独具特色的机箱设计,不仅可以保证系统在高配置下的散热和稳定行,同时也将极大地降低机器的噪音。

该方案属于具有高计算密度的GPU集群,CPU和GPU的比例高达1:2,更加适合于GPU承担大规模并行计算任务,符合中石化需要大幅提升计算效能,同时节约机房空间和服务器能耗的整体要求。

一直以来,GPU专为计算密集型、高度并行化计算的设计奠定了其在浮点功能上优越于CPU的局面,GPU所具有的强大计算能力和较高的存储带宽,对于高性能三维图形应用来说至关重要,以往GPU计算大多专用于这些应用,但现在新型的GPU允许具备一定的用户可编程性,这就使得GPU能够面向更通用的计算。此次的GPU系统构建,让中石化未来的系统需求得到了更好的计算保障。

总的来说,GPU是一项专用于解决可表示为数据并行计算问题的并行执行程序,它具有极高的计算密度(数学运算与存储器运算的比率)。由于所有数据元素都执行相同的程序,因此对精密流控制的要求不高。由于在许多数据元素上运行,且具有较高的计算密度,因而可通过计算隐藏存储器访问延迟,而不必使用较大的数据缓存。此次曙光公司为中石化提供的GPU计算集群系统方案,有效的解决了中石化当前的问题。

该计算平台融入了曙光公司强大的技术支持能力,尤其是GPU应用方面的深厚功底,目前,该平台已投入到正常应用当中,该解决方案的提供为中石化日后需要强大计算需求的研究提供了重要的技术保障。在实现简约管理的同时,可有效减少用户的后期维护和管理成本,颇受用户的欢迎与好评。