石油,藏在海量数据里
中国石油集团东方地球物理公司研究院作为中国地球物理界最大的专业服务公司,研究重点处于地球物理勘探三大环节??采集、处理、解释的后两个环节。成立于2003年7月的东方地球物理公司研究院大港分院,承担着研究院靠前处理、解释等综合服务。
随着石油勘探和处理技术的发展,高精度地震勘探方式已成为油田勘探的主流。面对野外大数据量采集,地震资料处理必须借助高性能并行计算机才能对这些数据进行复杂的室内处理。大港分院曾友爱副院长介绍说:地震勘探的核心是对地震波数据的采集、处理和解释,最后尽可能真实地反映地下的地质构造。
数据处理的难点在于数据量大、运算量大。一方面,在地震勘探数据的处理方式上,更先进有效的计算方式要求更快的CPU和主频;另一方面,随着石油勘探技术的进步、采集精度的不断增加,野外数据采集的数据量呈几何级数的增长,如何能够批量处理较多的任务对大港分院的处理系统设备提出了新的挑战。
刀片,少花钱多办事
2004年1月大港分院选用了以HP刀片式服务器为节点组成的高性能计算集群系统,并安装了CGG、Geodepth等处理软件。
为什么选择刀片服务器?对地球物理勘探这样长期、大量使用高性能计算机的行业来说,为了解决超大数据量的计算处理问题,过去曾采用过主机带阵列机、向量计算机以及90年代采用的大规模并行计算机,这些方式对于提高计算速度和处理能力都起到了重要的作用。但随着地质结构越来越复杂,迭前偏移工作量越来越多,大量的迭前偏移处理任务需要越来越强大的计算性能。完全选择基于Unix的超级计算机系统则需要巨额的投资,而随着工业标准服务器的发展,PC集群系统在主频和处理能力方面已经完全能够胜任叠前偏移要求处理大数据量的任务,并还具有极强的可用性、可扩展性和可管理性,而且其性价比比基于Unix的并行机更为优越,用它来完成密集算法,能够大大节省成本。
大港分院副总工程师兼计算机服务中心主任张武斌介绍说:刀片式服务器作为一种高可用高密度的低成本服务器平台,在高密度、易扩展和低成本方面都更适合地震资料处理的要求。和机架式服务器相比,刀片式服务器的优势主要体现在:刀片服务器在通风、耗电等方面,比1U机柜更适合地球物理的应用;刀片式服务器集群节点密度高于传统的1U机柜,而占地面积更少,可以在有限的空间整合巨大的运算能力,即使在未来增加更多的节点,也不需要考虑机房空间问题;在密集型的高性能计算中,刀片式服务器在布线和相互连接方面比传统的机架式服务器又有很大的改进。使用刀片式服务器时,布线更加简单。
地震资料处理对高性能计算系统的要求集中体现在计算处理速度快、存储量大这两个关键指标上。此次引进的HP ProLiant BL20P G2是一款带有双处理器的刀片式服务器,它采用高性能的英特尔至强 DP 2.8GHz/533 MHz处理器,带有SAN存储能力,支持多达8GB的PC 2100 DDR内存和千兆以太网卡。此套高性能计算系统以HP Smart Array 500集群阵列盘柜作为存储系统,由于MSA500提供了高速缓存读写比例调整功能,使写的速度由20MB/s提升到60MB/s(实际测试值),很好地突破了传统高性能计算系统在“写”功能上的局限性,有效加快了地震资料处理速度。
管理,便捷高效率
经过近半年的安装和试运行,系统在2004年7月22日正式投产。系统投产后,浮点计算能力达到每秒14000亿次,实现二维常规处理12000千米、三维常规处理6000平方千米、迭前偏移处理3000平方千米的年处理能力,使大港分院地震资料处理能力和处理水平获得大幅度提升。
张主任认为,以HP ProLiant BL20P G2为节点的高性能集群系统试运行以来,感觉之一是系统管理的便捷性。“HP提供的集群系统管理软件Cluster Management Utility具有强大的管理功能,而且它的远程管理特性使我们能够在任何终端管理集群系统,查看机器的运行状况,无论服务器处于何种状态。现在,我们在自己的办公室里就可以管理这套系统,不必再跑到机房了,非常便捷。”由于CMU具有将一个节点的系统磁盘分区克隆到其他集群节点的能力,使大港分院能够在3天内就完成了集群系统的安装。
同时,HP ProLiant刀片服务器配置了HP Insight Manager 7,用户采用这一基于Web的企业管理控制台,可以通过Insight Manager管理所有的刀片式服务器,而且还能管理存储、电源、打印机等。这些功能强大的管理软件使大港分院IT人员能够更高效、更低成本地管理和控制数据中心的数百台服务器。
现在,大港分院把原有高性能计算系统作为前端机,与HP刀片式服务器高性能集群系统通过光纤千兆网络连接,有效解决输入、输出瓶颈,实现了内部生产网络互联,真正实现了处理、解释一体化运作模式,全面提升了大港分院的生产力。借助强大的计算能力,大港分院能够处理过去难以想象的任务,提供更加优质的处理和解释成果。
相关链接
系统成员表
硬件系统
● I/O节点:采用主频为3.06Hhz的HP ProLiant DL380G2 2U机架式服务器
● 计算节点:主频为2.8Hhz的HP ProLiant BL20pG2刀片式服务器
● 监控分发节点:HP ProLiant DL380G2 2U机架式服务器
● 管理节点:HP ProLiant DL360 1U机架式服务器
● 互连网络系统:HP ProCurve Switch 高性能网络交换机
● 存储系统:HP Smart Array集群阵列盘柜
软件系统
● 操作系统: Redhat Linux 7.3
● 集群监控系统:HP Insight Manager、ProCurve Manager等
● 集群管理系统和集群部署系统:采用Cluster Management Utility(CMU)
● 并行环境:支持PVM、MPI
● 作业管理系统:OpenPBS