提升高性能计算的性能与效率:不要再看CPU
[导读]无论是赖能和还是张铁钢,他们已经意识到,单纯依靠CPU提高工作负载能力、加速石油行业高性能计算性能的时代已经一去不复返
DOSERV服务器在线 8月8日原创报道: 谁拯救了美国的能源危机?不是奥巴马,也不是埃克森美孚,更不是一直动荡不安的中东石油,而是页岩气,自2006年起,美国页岩气产量大幅增长,到2011年,美国页岩气产量高达1800亿立方米,占美国天然气产量的34%。
其间,在2009年,美国天然气产量达到6240亿立方米,首次超过俄罗斯成为世界第一天然气生产国,此后一直维持在这一位置。2012年美国天然气产量6810亿立方米,是世界天然气增产最迅速的国家,比位居第二的俄罗斯天然气产量多出900亿立方米。
此后,页岩气革命对美国的能源结构产生重大影响:美国每百万英热(计量单位)天然气均价为2.86美元,同期东亚同等热值天然气价格为16美元~18美元,欧洲12美元~14美元——虽然页岩气的价格下跌导致很多页岩气开采气田和石油公司无利可图,但如此价廉、清洁、高效和储藏量庞大的页岩气资源,让美国摆脱了石油和天然气价格高企的今天所面临的能源危机。
而现在,美国已经开始考虑开采页岩油,与传统油气资源类似,页岩层中的油气资源也相伴而生,页岩油属于轻质油,油质好,但比之传统直井油田直接从油层抽取原油,开采页岩油采用水平钻井和水力压裂技术从页岩层中获得,其开采成本也更高一些,即便如此,在较高的国际油价面前,开采页岩油仍有利可图。
但无论开采页岩气还是页岩油,工程建设与开采技术都是其中的关键。以页岩气为例,页岩气,是指位于暗色泥岩或者高碳泥页岩中,以吸附或者游离状态为主要存在方式的天然气聚集,地质结构复杂、蕴藏机制莫测、开采难度较高,事实上,自20世纪70年代就有企业开始探索页岩气的开采技术,但直到90年代才有成熟的开采、探测技术,而页岩气可以通过成熟、稳定的手段实现快速的发现、蕴藏量预测和开采,已经距离页岩气开采的提出者们的大胆想法,足足过了三十年。
“在勘探新的资源——页岩气——的过程中,要探测不同类型的岩层,但页岩——泥页岩和致密岩石——之间的区别并不大,这就对数据采集密度、精确度有着极高的要求,需要进行很大量的数据分析,这些都需要工程技术、信息化技术的支撑。”中国石油大庆油田公司勘探开发研究院总工程师张铁钢表示,在发现页岩气和未来页岩油的工作中,工程技术、信息化技术——计算、分析、存储——的需求量十分巨大,而也正是依靠——也必须依靠——这些技术,才能够实现大庆让老油田焕发青春的目标。
张铁钢表示,大庆油田的宗旨,就是“围绕资源优化,结合能源应用的特点高效利用工程和信息化技术”,让大庆油田能够不断完成国家交予的能源支持任务,实现让大庆油田能够持续实现产油、产气的重要保障。
在英特尔2013年度企业高性能计算研讨会上,来自全国能源行业的CIO代表们齐聚一堂,信息技术对国内能源行业——尤其是石油行业——发展的重要推动作用已经被他们清晰地认识到,他们来到冰城哈尔滨的目的,是希望能够了解到信息技术的发展与走向,以及交流如何利用信息化技术更快一步达成“好找油,找好油”的目标,寻找更多的油气资源。
而也正是在这次会议上,东方地球物理公司研究员处理中心总工程师赖能和老师提出:“不再需要关心处理器,而是要关心其它东西。”的惊人观点,为国内能源行业、石油行业的信息化技术利用提出了新的发展思路。
赖能和:不要看CPU了
“不用太过看重CPU,现在的CPU已经非常快了。”赖能和谈到,从2007年的宜宾到2013年的哈尔滨,七届高性能计算会议一路走来,他看到了x86架构处理器在过去七年不断的加速、加速、再加速,处理器的性能不断提升,而且“是完全不需要关心它(CPU)的性能提升速度和步伐”,在这样的背景下,石油行业的高性能计算却仍然遇到了挑战。
赖能和谈到,伴随油气勘探采集与处理新机遇的,是高密度海量数据处理正面临新的挑战:1、可控震源高效采集技术快速发展并广泛应用;2、高密度、高覆盖采集与处理技术提高勘探深度;3、高密度财季成为新的趋势,数据体越来越大。
“高频率、宽频带单点、单源的高效采集技术,使得每天产生的数据量大增,总数据量相关前约270TB,相关后90TB,一天就是7.5TB的数据(相关前),现在一炮(探测炸点)的数据相关后就是490MB,但是往往一天就要放5000炮。”赖能和认为,石油能源行业的地质、地震勘探正在朝着三维化、立体化、高密度、高覆盖度发展,这有效提高了对地层探测的精确程度和成像效果,但问题是:数据量越来越庞大,而高性能计算集群的计算性能却永远满足不了需求。
“CPU计算资源需求和海量数据存储需求都在急剧增长,对传统HPC技术提出了挑战。”赖能和表示,无论是从总套数、每套核数、还是每套的计算性能上来看,油气行业的高性能计算系统的水平都在提高,这说明高精度的地震成像、地质勘探算法需要海量的处理器资源,但既然已经买了很多的处理器,且处理器的性能提升越来越快,甚至“仅从计算量上来看已经问题不大”,但为什么却仍然难以满足需求,无法得到更精确的处理结果呢?
赖能和答案是“效率”:“我们以前处理器的效率非常低,最高才百分之十几,最低的时候只有2%,后来优化之后,效率最高能够接近40%,但是低的时候也只有15%,关键是要提高计算集群的效率。”赖能和提出,针对海量数据的高性能计算解决方案,要从五个角度来解决问题:
1、 高性能:采用最先进的CPU、PCIe架构
2、 高配置:采用大内存、大内置盘
3、 高带宽:采用全线速、无阻塞的高速网
4、 高效率:采用高可扩展的并行存储系统
5、 高吞吐:针对不同应用,选择存储软硬件架构
“你像我们的第一套系统,投入了2000多万,全部使用高性能并行存储系统、10GbE万兆以太网,而且都装了5块15k转的6G SAS硬盘,使用双路英特尔E5-2670服务器,经过调优后,并发运行后的效率从之前的最低3.65%现在提高到了44.37%。”赖能和说,这一数据实际上还有提升的空间,“通过优化配置,处理器的利用率能够大幅度提升,我的观点是,先不用着急买处理器,先把自己现在的处理器用好了再说。况且用好了现在的东西,才好说再去买,到时候就可以说‘你看,我们已经用的很好了’。”
赖能和还展示了一套大约2、3年前采购得高密度海量处理系统(基于至强X5660双路服务器)的优化结果:通过扩展24GB内存到96GB,增加计算节点内置盘及更换512K Cache的RAID卡,全面升级万兆以太网,新增14个计算和I/O节点,并使用并行存储系统取代原有的普通存储——在作业数为10、50、100的测试中,此次改造分别提高了4倍、10倍和8倍。
“马上我们计划第三、四套高密度海量处理系统,除了使用英特尔至强E5-2670双路服务器之外,我们会加大内存、内置盘以及使用万兆以太网,只有这样才不会浪费处理器极大的计算资源。”赖能和表示,使用高性能的处理器,必须要在网络、内置盘、带宽等层面予以全面配合,再加上协处理器,才能够达到想要的效果,处理器的效率才能够发挥出来,因此他对HPC新技术的应用提出了基于石油行业的需求与展望。
1、 CPU+协处理器组成的协同计算平台:基于多核、众核CPU技术、CPU+协处理器或CPU+GPU组成的HPC和多路服务器仍将成为主要的应用平台。
2、 高性能并行存储软硬件系统及固态硬盘SSD技术:以大容量、高性能、低功耗、低热量和低噪音的并行存储和新型节能存储介质技术将高速发展。
3、 高速网络技术:万兆网络技术将成为应用主流。
4、 基于水冷等新型节能技术,将成为关注的重点。
5、 云或移动计算平台:基于计算、存储、可视化资源池等基础设施整合的新的商业模式,将向用户提供服务。
张铁钢:老油田比新油田“有料”
“地质学家有一个论断:‘在一个大油田,已知油田中发现的储量要比在新区发现的油田的储量多60%’ ,甚至于说基本上新的油气资源都是在老油田之间更深的地方找到的。”中国石油大庆油田公司勘探开发研究院总工程师张铁钢在接受DOIT记者采访时表示,在中国的油气行业,每年都可以找到新的油田——正是在老油田或是老油田之间,他表示,无论是老油田焕发青春,还是继续发掘新的油气资源,对老油田的深耕必不可少。
因此,在我国传统的油气资源产区大庆油田,“利用多种综合勘探手段判断潜在资源”,是现在最重要的挖掘油气资源的方式,据张铁钢介绍,最近几年,大庆油田通过不断挖掘老油田、老油田之间油气产区的资源,不仅完成了国家要求的稳产任务,而且现在的油气产量并不比20、30年前差,作为开采已经几十年的老油田,“大庆稳产4000万吨”的目标仍然年年实现。
但实现稳产、挖掘老油气田资源,老油田比新油田“有料”不是简简单单就能够完成的任务,从油气资源成像上来看,产油的致密砂岩和不含油的砂岩密度差不多,原来油气资源丰富的时候,勘探开采比较容易,技术探测相对比较简单,但“现在的判断复杂度就高很多了,资源勘探的采集数据的密度较要加大,以前采集间隔小、数据量小,现在网格采集的密度则非常高,采集的点覆盖密度小可能就遗漏了。”
张铁钢表示,如今大庆油气勘探数据采集的密度越来越高,正如赖能和在会议演讲上所说的:“要高密度、高覆盖的采集数据,挖掘更多的油气资源。”,但这样做的成果也非常显著,不仅是老油田大庆实现了年年稳产,我国位居老油田前列的克拉玛依和胜利油田,“年年都能找到新的油田”,这其中,胜利油田就通过三维全覆盖技术以及高密度三维技术,不断发现了新的油气资源。
支撑三维全覆盖技术、高密度三维技术的关键是先进的工程建设与科学计算技术,如张铁钢来说“技术的进步就会带来资源的解放”。
“以往做地震、地质测试研究,区块都比较小,数据量很小,几十GB很多,但是现在高密度采集48平方公里,16TB的数据,尤其是针对已经开发过的油场,进行二次勘探,数据量更大、难度更大。”张铁钢介绍,现在使用高性能计算系统、多路服务器、英特尔至强处理器、高性能存储系统,多方协同三维数据解析的工作进展顺利,而基于虚拟化技术让两个专业软件同时运行,“这在以前是不可想象的”。
除此以外,在会议的演讲上,张铁钢还介绍了大庆使用云计算技术构建云门户的经验,通过构建云计算门户,大庆油田在内部服务、勘探资源的调配和快速上线上,获得了很大的收益,而利用虚拟化技术对门户服务器的优化,目前大庆油田门户服务器的利用高达70%,专业应用的系统利用率从20%提升到了40%,并“利用虚拟机管理许可证,随时利用空闲许可证,让资源灵活和浮动起来。”
“机器的性能和效率提高了,人的效率也就提高了,虽然初期需要购买一些管理软件,但长期的效益是巨大的。”张铁钢向记者表示。
英特尔服务高性能计算:不止是CPU
无论是赖能和还是张铁钢,他们已经意识到,单纯依靠CPU提高工作负载能力、加速石油行业高性能计算性能的时代已经一去不复返,在英特尔的处理器——至强和至强融核——不断加速并将其他IO远远甩在身后的情形下,提高高性能计算的性能,正在成为一场“全面战争”。
在这场战争中,需要被现代化的包括一长串名单:更快的、更大容量的内存;应当被闪存(或者说是SSD)取代的运转缓慢的传统磁盘;无法响应网络需求带宽严重滞后的1Gb以太网;应当更具扩展性的文件系统,凡此种种,这不仅是赖能和与张铁钢们的挑战,也是英特尔的挑战。
因此,在高性能计算行业,英特尔所提供的产品并不仅限于英特尔至强和至强融核处理器,而是一个全面的高性能计算效率与性能提高的方案。
首先,英特尔如今在提供面向数据中心的DC S3500和S3700固态硬盘,这两款产品虽然都基于SATA接口,但提供了足够高性能计算平台所需要的随机小块读写性能,以及更长期的寿命,而在PCIe闪存卡领域,英特尔的910系列闪存卡则更能够显著提高高性能计算系统每节点的IO吞吐量。
其次,英特尔一直在以太网领域提供大量的技术、产品和知识产权,英特尔不仅提供万兆网以太网适配器,现在还在提供融合网络适配器X520、X540系列,其中绝大部分都使用英特尔自己的控制器。
第三,英特尔在高性能计算的编译器、编程工具等领域,提供了大量基于标准的开发、编程工具以及不少行业标准的编译器。这些工具包括了VTune性能分析器、英特尔编译器(Intel Compilers)、Intel Thread Checker、Intel Performance Libraries、Intel Threading Tools、Intel Cluster Tools等,它们可以帮助高性能计算应用软件开发商或最终用户分析自己的高性能计算系统及应用软件特性,并最大限度优化其高性能计算机软硬件系统,发掘其最大性能潜力。
第四,针对高性能计算目前的文件系统问题,英特尔自2012年收购超级计算机集群解决方案文件系统Lustre之后,今年正式发布了英特尔发行版的Lustre文件系统,有效的提高了这一文件系统及大量高性能计算系统的的文件存储能力。
除此以外,英特尔公司还推出了“真实应用负载计划”,来帮助用户针对其真实的应用负载,而非通用的基准测试软件来进行调优,从而帮助他们从自己的系统上获取最大化的收益——从以上这些内容来看,英特尔在高性能计算领域绝不仅仅是推动CPU的升级和发展那么简单,再有可能成为高性能计算瓶颈的任何地方,英特尔都在投入技术、精力和时间,从而形成全面的高性能计算技术、产品提供商。