NetApp 网络存储技术在地震数据管理中的应用

      用户背景


      大庆油田公司勘探开发研究地震处理解释中心
 
      中国石油天然气集团公司(简称《中国石油集团》,英文缩写:CNPC)是根据国务院机构改革方案,于1998年7月在原中国石油天然气总公司的基础上组建的特大型石油石化企业集团,系国家授权投资的机构和国家控股公司,是实行上下游、内外贸、产销一体化、按照现代企业制度动作,跨地区、跨行业、跨国经营的综合性石油公司。


      作为中国境内最大的原油、天然气生产、供应商和最大的炼油化工产品生产、供应商,中国石油集团业务涉及石油天然气勘探开发、炼油化工、管道运输、油气炼化产品销售、石油工程技术服务、石油机械加工制造、石油贸易等各个领域,在中国石油、天然气生产、加工和市场中占据主导地位,在美国《石油情报周刊》最大50家世界石油公司排名中,中国石油集团位居第10位,在《财富》杂志2003年公布的世界500强企业排名中,由上年的第81位提升为第69位,并被评为“世界最受赞赏企业”。


      中国石油集团注册总资本1149亿元,现有总资产7362亿元,在中国境内东北、华北、西北、西南等广大地区拥有13个大型特大型油气田企业、16个大型特大型炼油化工企业、19个石油销售企业和一大批石油石化科研院所和石油施工作业、技术服务、机械制造企业,在中东、北非、中亚、俄罗斯、南美等地区拥有近30个油气勘探开发和生产建设项目。2003年国内生产原油10954.4万吨,生产天然气248.8亿立方米,加工原油9842.8万吨;同时在海外获取权益原油产量1288.4万吨、天然气产量13.9亿立方米。全年实现销售收入4752.9亿元,上缴税费760亿元,实现利润726.7亿元,实现利润在国内企业中位居榜首。


      大庆油田采油二厂是中石油下属单位,年产原油近千万吨,其信息部门从1998-1999年建设完成计算机局域网,现在计算机网络由厂、矿、队三级网络构成。信息中心机房为网络的一级中心,下联24个厂属单位及5个厂外单位。


      地震处理解释中心的主要工作是将地下地质的地震信号,通过地面提取后,用大型计算机进行处理。形成地下的构造以及地下的成像,发现地下的油气构造,并打井提供更加可靠的勘探数据。


      地震数据的爆炸性增长,对地震数据在存储系统得出了更高的要求,数据体在多个处理服务器及解释工作站之间,如何高速、快捷地传送,是制约处理解释周期的关键。网络存储技术的出现,从多个方面改善了地震数据存储系统的不足。本文通过对地震数据存储系统的现状及问题的分析,设计了基于网络存储技术的地震数据存储系统,实施后,极大地提高了各处理服务器、地震解释工作之间的数据传输效率,实现了地震数据处理解释一体化的布诸和管理。


      面临的挑战


      大庆油田公司研究院地震处理解释中心拥有联想深腾1800万亿次集群并行机(256个CPU)、DELL集群并行机(24个CPU)和IBM SP2(24个CPU)等多套地震数据处理系统,以及近25套(SUN/B2000)地震数据解释工作站,承担着三维叠前深度偏移处理、地震目标处理和解释任务。各处理服务器及解释工作站均配置有基于主机的直接存储(DAS-Direct Attached Storage)磁盘陈列,DELL配置6TB磁盘、IBM配置900GB磁盘、每台SUN/B2000配置180GB磁盘;地震数据处理服务器和解释工作站采用155MB ATM 技术构成地震处理解释网络。


      以SUN工作站为主的地震解释工作站,分布在研究院处理解释中心机房、勘探综合楼和勘探一室(楼)内,这些解释工作站系统利用研究院的ATM(155Mb/s)的主干网络互连在一起。在每台解释工作站都有自己的本地磁盘用于存储地震解释成果数据。地震数据处理解释网络结构参见下图。


 



      从上图可以看出,研究院使用ATM 155Mb/s的主干网络实现各种解释工作站系统互连,这些工作站系统分布在处理解释中心3号楼(勘探二室)、综合楼(地震方法室)和勘探一室楼内,楼与楼之间使用多膜光纤连接,目前传输速率为155Mb/s。其中位于处理中心的勘探二室与综合楼的距离为700米左右。综合楼到勘探一室的距离为200米左右。在研究院共有近25套SUN工作站运行着各种地震解释软件,总共使用的磁盘存储空间为2.5TB。每台工作站上都有10M/100M网卡。


      随着野外地震数据采集量的爆炸性增长,一块三维地震工区的覆盖面积达到了600平方千米,原始数据量为700GB以上,因此,如何有效地加载、存储和处理解释地震数据,缩短地震数据处理解释周期,对地震数据存储系统的容量、性能和可用性提出了更高的要求。目前的地震数据处理解释存储系统面临如下问题:


      (1) 数据分散存储,非常不利于处理成果数据体、解释中间结果和成果数据的管理及保护;


      (2) 地震数据不能及时地被多台解释工作站共享,有时数据的共享需要磁盘加载实现;


      (3) 地震数据从处理服务器传输到解释工作站受到ATM网络带宽的限制,制约着地震数据处理解释的生产周期;


      (4) 数据的分散存储、管理复杂,不能被集中存储管理,给数据安全带来危害。


      解决方案


      基于研究院地震数据存储管理存在的问题,有必要采用网络存储技术建立统一的地震数据集中存储管理系统,实现地震数据处理系统和解释工作站之间的数据共享和交换,达到地震数据处理解释一体化的目标。地震数据处理服务器完成数据处理任务,处理后的CRP道集和成像数据体传送到网络存储系统,地震解释工作站从网络存储系统中读取成果数据进行解释、成图,解释成果再归档到网络在存储系统中,供地质综合研究人员进行分析和探井设计。方案的技术关键是建立网络存储系统,实现地震数据处理服务器和解释工作站之间的数据共享和交换,提高处理解释效率,缩短地震数据处理研究周期。


      数据存储技术从DAS(直接连接存储)到NAS(网络附加存储)、SAN(存储局域网)的发展使数据应用环境从以服务器为中心转向以存储为中心。目前SAN技术主要面向以块I/O的高性能数据中心应用。而NAS则面向以文件共享的小数据块为应用的共享分布式存储应用,为TCP/IP网络上的各个服务器/工作站提供快速的数据文件共享。


      NetApp公司的NAS存储技术是一种专业的网络文件存储及文件备份技术,或称为网络直联存储设备、网络磁盘陈列。一个NAS存储系统中包括核心处理器,文件服务管理工具,一个或者多个的硬盘驱动器用于数据的存储。NAS可以应用在任何的网络环境当中。主服务器客户端可以非常方便地在NAS上存储任意格式的文件,包括SMB格式(Windows)NFS 格式(Unix, Linux)和CIFS格式等等。NAS系统可以根据服务器或者客户端计算机发出的指令完成对内的文件的管理。另外的特性包括:独立于操作系统平台,不同种类的文件共享,交叉协议用户安全性/许可性,浏览器界面的操作/管理,和不中断网络来增加和移除服务器。


      1.      地震数据处理解释对网络存储的需求分析


      根据研究院地震数据处理服务器和解释工作站所拥有的磁盘存储空间为9TB和2TB,随着处理解释工作量的不断增加,预计存储处理成果数据及解释成果数据的集中存储空间需要2TB到3TB的容量。因此提出采用NetApp公司的NAS存储技术来整合现有的地震处理解释系统。建设一个以NAS为存储中心的地震数据处理解释系统应用环境。


      (1)   容量上的需求


      考虑将来的发展需求和目前现有的存储空间情况,第一期将NAS文件服务器配置成2TB或3TB的存储空间比较适合。一是加载近几年处理完成的地震成果数据,加快这些成果数据的解释和应用;二是备份现有的各台解释工作站上已完成的解释成果数据,实施解释成果数据的集中存储与管理;三是加载油田探井的测井曲线数据,为探井综合评价提供数据服务。在NAS文件服务器上实际配置2TB的存储容量,使整个地震数据解释系统的总存储空间达到4.5TB(加上原来的2.5TB),并且留有4TB的可扩展存储空间。


      (2)   性能上需求


      由于地震数据处理解释的数据集中存储在NAS设备中,这就要求NAS存储设备、网络数据传输路径、都要有适合地震处理数据传输的性能。因此不仅要选用业界性能最佳的NAS存储设备、而且还要局部地改造研究院现有的骨干网络,提升数据传输线路的带宽。


      (3)   安全上需求


      数据安全是地震数据处理解释生产中非常重要的工作,它不仅影响到生产的周期、而且会影响到研究院多年的地震数据处理解释成果。因此选用的NAS存储设备和相应的软件必须具有非常高的安全保护技术、达到数据集中后对数据的安全保护。


      (4)   集中简单管理需求


      数据的集中必然带来了数据的管理问题。因此在作到集中管理的同时,还要实现管理简单、界面丰富、实施容易等需求。


      2.      地震数据处理解释存储系统的设计目标


      (1) 地震处理成果数据、地震解释成果数据和测井曲线数据将集中存储到安装在勘探综合楼内的NAS存储服务器中去。实现重要的地震、测井数据的集中存储、管理和共享;


      (2) 实现NAS存储服务器与勘探研究科室之间的千兆(1000Mb/s)以太网连接,提高数据传办输网络的带宽,各二级交换机到用户解释工作站之间达到100Mb/s的桌面连接,保证数据的交换速率;


      (3) 所有SUN的工作站和NT/WINDOWS系统实现文件级共享,保证地震数据、测井数据和必要的文本文件实现无须手工干预直接使用;


      (4) 保证数据的安全,利用NAS存储服务器安全性,及SnapShot等技术保证集中存储数据的安全性;


      (5)   尽可能节省投资,利用研究院现有的光纤等网络设施在充分考虑将来需要的情况下节省用户的投资。


      3.      网络存储系统的设计方案


      针对上述需要分析并结合NetApp公司的NAS存储技术,采用NAS存储技术对研究院地震数据处理解释系统进行整合是一个满足实际需求的解决方案。


      在构建研究院地震数据处理解释存储系统时,以NetApp的Filer F840存储设备为核心,并对研究院的骨干网络进行局部改造,建立基于千兆网络技术的地震处理解释专网,实现处理服务器、解释工作站与NAS存储器之间的高速传输。


      (1) 地震数据处理解释网络的升级改造


      研究院目前的骨干网络是以ATM(155Mb/s)为主干的网络。因此需要将地震数据处理解释各个科室所在的网络改造杨1000Mb/s以太网络,在网络升级改造方案中使用CISCO的骨干交换机来建立地震处理解释专网。


      (2) 各个建筑物之间网络光纤的改造


      NAS设备F840将安装在勘探综合楼,与勘探二室所在的处理中心楼之间的距离大约有700米,使用目前的多膜光纤在1000Mb/s的传输下只能支持550米,因此要使用光纤中继器或延伸器来实现,使用光纤中继器是在现有光纤中间安装中继器来实现,使用延伸器是在光纤的两端安装延伸器来实现,但费用稍高;勘探综合楼与勘探一室之间的距离为200米,使用目前的多膜光纤即可。


      (3)   地震数据处理解释存储方案总体设计


      根据实际需求,设计了以NetApp NAS文件服务器F840为核心的研究院地震数据处理解释存储系统。


 



 


      从上述的网络拓扑结构图中,NAS存储器F840安装在综合楼内,配置CISCO的Catlyst4003交换机作为中心交换机。F840利用两个1000Mb/s的接口与中心交换机4003利用多膜光纤连接。而4003中心交换机和在计算中心1号楼、地震数据处理一室配置的CISCO Cat3524之间借助目前以有的多膜光纤来实现连接。地震数据解释工作站利用100Mb/s的以太网卡的RJ45实现上连。计算中心1号楼与综合楼之间距离超过550米,因此方案使用光纤延长器(2个)来实现连接。


      该方案的整体设计思想是在勘探综合楼内配置CISCO Cat4003中心交换机和NetApp的F840文件服务器。在F840上配有两个1000Mb/s的多膜光纤接口实现与中心交换的冗余连接。在勘探两个科室内分别配置一台CISCO 3524交换机,实现1000Mb/s上连,及100Mb/s的下连到解释工作站。保证了数据传输性能和数据的安全存储。整个方案充分体现了以NAS为中心的存储整合。


      NAS存储设备选用业界技术最成熟、性能最优、应用广泛的NetApp F840


      综合楼的中心交换机选用业界技术最先进的CISCO公司的Catalyst 4003


      安装在计算中心1号楼(勘探二室)、勘探一室的二级交换机选用CISCO的Catalyst3524     


      在计算机中心一号(勘探二室)与综合楼之间用于光纤信号增强的光纤延伸器选用美国MRV公司的Fiber Driver Gigabit Multimode Extender


      1.      网络存储方案的实施


      (1) 千兆网络环境的安装调试


      在指定地点安装MRV光纤延伸器和CISCO公司的Catalyst4003、C3524交换机;上电配置C4003和C3524,提供交换机的管理IP/掩码,设备命名规则,网关地址、DNS IP和域名、VLAN号分配规则、C4003上联到骨干交换机;进行网络连接及连网测试,并构成NAS所需的网络环境。


      (2) F840存储服务器的安装调试


      F840存储服务器的控制器、磁盘柜上架;网络电缆连接到F840上;提供F840的IP地址和子网掩码,DNS服务器的IP地址,缺省网关的IP地址,F840主机名,须有mail主机名和IP地址,须有网络工作站,至少于Hot Spare、两块备用、剩余36块分成(9+1)4个RAID组;在F840上安装调试NFS、CIFS、SnapRestore等软件;当所有设备安装调试完成后,将进入系统联调阶段,联调阶段要调通网络功能、文件共享功能、快照功能及快照恢复功能。


      运行效果


      2003年初地震数据处理解释存储系统投入生产,主要应用于地震处理成果数据、地震解释成果数据和探井测井曲线数据的存储和管理。


      NAS存储服务器上配置了39块72GB FC磁盘,目前使用了34块磁盘作为数据盘,另外的5块盘作为Spare Disks.磁盘的划分见下表:


 


      NAS存储服务器的磁盘划分







































Name


Used


Total


Avall.


Dlsks


Vo10


(root)


0%


53.8GB


53.5GB


2


Vo11


66%


376GB


127GB


8


Vo12


81%


376GB


70.2GB


8


Vo13


100%


376GB


0Bytes


8


Vo14


99%


376GB


3.64GB


8


      其中:


            Vo10用作系统盘;


            Vo11用来存储测井数据,使用了249GB的磁盘空间;


            Vo12用来存储地震解释成果数据,使用了306GB的空间;


            Vo13、vo14用来存储地震成果数据,使用了753GB的磁盘空间。


      NAS盘上的数据,主要采用了NFS方式出口给勘探科室的地震数据解释工作站,用于远程数据文件服务,用户可以方便快捷地下载地震数据和测井数据。系统管理员主要通过HTTP方式,在办公室的微机上,使用NAS的FilerView功能来管理NAS系统。在数据安全管理方面,开启了NAS存储服务器的快照功能(SnapShot),每日白天三次,晚间快照2次。


      NAS存储系统运行期间,会定期发出E-mail给系统管理人员和NetApp的客服中心,及时报告系统的运行况状和故障信息,NETAPP公司有专门人员检查NAS存储系统的运行情况,出现的错误,他们会及时定位、排除。


      到目前为止,整个NAS存储系统运行正常,满足了油气勘探攻关项目的数据需求,解决了勘探项目组不能及时得到地震处理成果数据、测井曲线数据,影响地质综合研究及井位设计进度的问题。据勘探研究人员测算,该存储系统的成功应用,使勘探研究人员加载地震和测井数据的时间缩短了2/3;地震解释成果数据的及时传送,加快了地质分析和成图的进度;并且实现了地震、测井数据存储管理的高可靠性、高可用性和高安全性的目的。