Platform助力中国石油西南油气田公司勘探开发研究院

中国石油西南油气田公司勘探开发研究院始建于1953年,是我国石油天然气勘探开发行业中建院较早,集石油天然气地质勘探、油气田开发、地质开发试验和计算机应用等为一体的综合性应用科学研究机构,其主要任务是围绕川渝油气工业发展目标,开展各级重点科技项目攻关,资源评价,编制勘探开发规划、油气田开发方案,为开拓油气勘探新领域,扩大后备资源和科学、合理、高效开发油气田提供重要科学依据。

  亟需轻量级、高效的监控管理系统

  油气勘探与开发要面对着多种多样的复杂多变的地质情况,特别是在我国,油气田大多埋藏于几百甚至几千米的地层深处,而且地质状况复杂,准确寻找油气田位置非常困难,油气勘探与开发呈现高风险、高投资和见效慢的特点。为了提高勘探的精度,缩短勘探时间,高性能计算技术被引入到石油勘探业务中,成为石油勘探业务提高效率的利器。

  中国石油西南油气田公司勘探开发研究院一直走在用高性能计算技术助力油气勘探与开发的前列。从1977年为承担引进的用于测井资料处理解释的85机的管理需求组建第七研究室开始,经过30余年的发展,中国石油西南油气田公司勘探开发研究院计算机中心已经拥有大中型计算机服务器、PC集群、专业计算机工作站等设备组成的计算机群,形成了包括地震数据处理和解释、测井数据处理和解释、油气藏数值模拟、油气藏生产分析、三维地质建模等处理和解释能力,成为西南油气田公司最大的计算机技术应用中心,为川渝老气田稳产,并加快增储上产步伐,着力推进技术创新寻找新的勘探目标,提供了强有力的计算机应用服务。

  由于油气勘探计算机应用环境管理的复杂性,中国石油西南油气田公司勘探开发研究院一直在寻求一个简洁的、轻量级的、全面的、高度集成的计算中心监控管理解决方案,该解决方案要能对计算中心所有主要软件的应用情况、硬件设备状况,包括:许可证、数据库、服务器、交换机、存储、UPS、机房环境等实现全面的监控;能够针对所有被监控的设备提供功能全面的异常报警功能,能快速发现和定位问题;其本身的系统要求开销极低,对监控对象的干扰几乎可以忽略不计,同时其监控信息收集的功能又必须高效、强大,在保证监控信息足够详细的情况下,其数据收集延迟最小可到秒级,从而达到极高的时效性和实用性。例如针对机器监控,中国石油西南油气田公司勘探开发研究院定义了30多项监控指标,包括:CPU利用率、内存利用率、IO、网络流量、网卡状态、CPU温度、CPU风扇、当前进程、活动用户、本地磁盘、NFS磁盘、BIOS状态等,这些信息在特定情况下,必须数秒内更新,以保证对机器监控的精细程度,满足性能分析和调优的要求。

  Platform Cloud Insight–一体化、集成的IT信息管理软件

  在考察了业界主要的高性能计算解决方案提供商之后,西南油气田公司勘探开发研究院选择了全球领先的集群、网格、云中间件和云管理平台提供商Platform公司的Platform Cloud Insight解决方案。Platform Cloud Insight将资产管理、资源监控、统计分析和常用的系统管理功能有机地整合在一起,利用Platform Cloud Insight,系统管理员可以一站式地完成大多数日常的系统管理工作,极大地简化系统管理工作的复杂性、减少工作量。

  Platform Cloud Insight提供了以下功能:

      集中、全面的IT基础设施监控管理。Platform Cloud Insight通过包括Platform专利的EGO资源管理协议以及SNMP、IPMI、Telnet、SSH、JDBC、SYSLOG、Flexlm/Flexnet等多种协议和方法,提供了对计算中心几乎所有软、硬件设备的监控功能,包括:机器、交换机、存储系统、UPS、数据库、软件许可证、机房环境;并提供针对这些设备详细的、全方位的信息收集和必要的远程管理功能。

      基于角色的权限管理和访问控制。Platform Cloud Insight支持细粒度的系统管理权限划分和角色定义,可以轻易定制多种角色,以不同的权限访问系统。例如:可以定义网络管理员、存储管理员、数据库管理员等多种角色,相应地只分配合适的权限,避免管理员权限过大和不必要的误操作。

      强大的报警功能。Platform Cloud Insight提供了强大的事件配置和报警功能,几乎所有的监控指标都可以定义为报警事件。并且,Platform Cloud Insight可以在全局层面和指定设备层面配置报警事件,实现从宏观到精细的事件报警。

      高扩展性、超轻量级和高效率。针对计算中心数量占绝对多数的服务器设备,Platform Cloud Insight通过底层使用Platform专利的EGO资源管理技术,实现了高扩展性、超轻量级和高效率。Platform EGO已经在多家客户生产环境中实现了5000个机器以上的统一资源管理和监控,并且在这种情况下,即使监控数据更新的延迟设为数秒,产品本身对被监控机器的系统开销(CPU、内存、网络等)极低、几乎可以忽略不计。

  从“黑箱”变为“白箱”

  通过实施Platform Cloud Insight解决方案,中国石油西南油气田公司勘探开发研究院将资产管理、资源监控、统计分析和常用的系统管理功能有机地整合在一起,通过浏览器就可以轻松、方便地监控管理计算中心几乎所有软、硬件设备,计算中心的运行情况,通过网络拓扑图和物理拓扑图结合,大大提高了计算中心设备可视化程度,通过Cloud Insight性能统计分析功能,找出各种设备的运行规律,从而制定有效的报警策略,实现异常的快速发现和报警,大大减少了计算中心设备故障率和故障时间,提高了计算中心的服务水平,在提高系统管理员对故障的响应时间的同时,减少了系统管理员的工作强度。

      统一的勘探开发数据库监控管理。针对中国石油西南油气田公司勘探开发研究院的多套勘探开发应用数据库,Platform Cloud Insight提供了统一的监控界面,可以快速、详尽地监控Oracle 9i, 10g等不同版本数据库,包括数据库服务器的状态(CPU,内存,IO,CPU温度、风扇等)和数据库本身的状态(包括进程状态、内存使用、用户、表空间、文件、Session、后台作业等)。很多监控信息,即使是熟练的DBA,也很难快速、直观地获得。通过Platform Cloud Insight,中国石油西南油气田公司勘探开发研究院显著提高对多套勘探开发数据库的监控效率和详细程度,大大降低了数据库监控管理的技术门槛。

      详细、高度关联的存储系统监控管理。Platform Cloud Insight对存储系统监控管理不仅是针对存储本身,而是将磁盘阵列、交换机(光纤交换机、以太网交换机等)、存储服务器、文件系统有机整合在一起,提供一个详细且高度关联的监控界面,帮助存储系统在各个方面的性能调优。例如:针对中国石油西南油气田公司勘探开发研究院高性能计算系统的存储监控,Platform Cloud Insight同时提供了存储服务器状态、并行文件系统状态、光纤交换机流量和端口状态,存储磁盘LUN的读写状态监控。系统管理员可以通过Cloud Insight检查并行文件系统中多台存储服务器的负载和读写是否均衡,从而针对文件系统进行调优;存储上每个LUN的读写是否均衡,从而调整存储配置,达到最大的条带化读写效率;光纤交换机流量是否饱和和端口状态,从而确定多路径软件是否工作正常。

  中国石油西南油气田公司勘探开发研究院计算中心应用研究室主任王军介绍说:“选择Platform Cloud Insight是从我们管理业务本身和适用性上考虑的,在实测中,软件本身的系统开销(CPU、内存、网络流量)不到0.5%。Platform Cloud Insight可以充分满足我们对监控软件的要求。”