惠普保障广州供电局关键业务持续运行

广州供电局简介

广州供电局是中国南方电网广东电网公司下属的特大型供电企业,为广州市10个行政区和2个县级市供应电力,供电面积7,434平方千米,供电人口953万,供电客户401.5万户。2006年,广州供电局的供电量429.72亿千瓦时,同比增长11.12%。

作为南方电网公司的基层供电企业,广州供电局积极主动承担社会责任,努力为建设创新型国家、建设社会主义新农村、建设资源节约型和环境友好 型社会、构建和谐社会贡献力量。"对广东电网公司负责,为广州经济社会发展服务",广州供电局以此为宗旨,主动承担社会责任,致力于建设结构合理、技术先 进、安全可靠、适当超前的现代化广州电网,服务于南方电网和广东电网的大局,为广州社会经济的发展当好先行官,发挥有限资源的最大效益,切实保障了广州经 济社会发展的用电需求。

广州供电局获得了2006年度全国电力用户满意企业、广东省优秀企业、广州市先进集体等光荣称号。2006年8月,广州社情民意研究中心公 布了"广州社会心理与情绪追踪调查"结果,电力供应在40项评价指标中满意度排名第一,这是自2001年以来连续6年位居经济类指标满意度第一。

面临的IT挑战

广州供电局目前拥有营销系统等多个重要业务系统,其中用电营销系统、电费核算中心、GIS、Portal、门户网站等关键业务系统运行在 HP小型机加存储阵列的模式中。目前,广州供电局已经建成了数据中心和备用数据中心两个机房,利用光纤通道,将主、备数据中心的IP网络连接起来,并且可 以通过备用数据中心的备用出口连接局宽带数据网。存储网络方面,广州供电局已经备有多台存储光纤交换机,2台存储路由器,主、备数据中心之间的存储光纤通 道已经开通,存储设备的管理IP网络也已经建成。

在实施惠普容灾解决方案之前,广州供电局信息资产高度集中,数据中心集中了大部分IT设备,如果出现火灾、水淹等等意外情况,该机房受损, 公司的信息系统将受严重影响:如果机房出现灾害,造成系统失灵,将出现较长时间的服务中断,主要原因是系统恢复和数据恢复的时间较长;如果系统不是彻底损 坏,可以维修,维修时间将在2周到1个月;如果重新采购,时间大概2~3个月左右;另外即使设备得到维修或购买到设备,由于数据丢失,恢复系统正常运行将 花费大量时间,不是短期能够恢复的。所以在没有容灾系统的情况下,一旦发生灾难,恢复IT系统时间较长,而且如果数据丢失,甚至可能没法恢复关键数据。

一般来说,可将灾难分成下面几个类型:自然灾难(洪水、飓风、地震),外在事件(电力或通讯中断)、技术失灵(电脑宕机或网络受损)及设备 受损(火灾)等。由于商业系统会因为计算机系统和网络的紧密连接而受到很大影响,企业蒙受的冲击及财务损失可能如同灾难本身一样可怕。因而,无论导致网络 瘫痪的原因是地震,还是磁盘失效,都需要容灾解决方案帮助人们将灾难对企业业务的损失降低到最小。

惠普的解决方案

业务连续/容灾解决方案(Business Continuity / Disaster Recovery Solution)是惠普专为希望采用远程灾难恢复的方式,实现关键业务数据保护的企业用户,提供实施帮助而设计的,它通过惠普公司业务连续专家、项目管 理专家和一系列经过验证的分析、设计、实施以及测试服务步骤为用户提供全面和详尽的容灾方案部署和应用。

本项目采用业内最先进的业务连续知识方法体系,将国际标准的方法论和惠普长期的业务连续系统建设经验相结合,从客户实际出发,实施了符合广 州供电局业务需要的、切实可行的、端到端的整体容灾解决方案。本项目不但包括高可用的信息技术基础平台建设:涵盖从服务器、存储系统、光纤网络互连设备到 应用软件、数据库的全部IT相关范围,还包含了IT环境风险评估(DRA)、业务影响分析(BIA)、业务持续性管理团队建设、人员培训和容灾知识普及、 灾难恢复流程开发(DRP)和真实环境的演练等内容。同时惠普还为广州供电局提供了项目实施完成之后的持续支持服务,定期对用户的容灾系统进行健康检查和 灾难恢复演习,防患于未然。在容灾切换技术上,本项目采用了惠普领先的同城集群自动切换技术,成功完成了中国首个基于HP EVA存储的同城集群自动切换软件(HP Metro-cluster)的实施。

需求分析

需求分析阶段的工作包括:灾难风险评估、业务影响分析、容灾系统需求分析。灾难风险评估:分析现有IT环境所面临的风险和薄弱环节,确定降 低风险、改进薄弱环节的风险控制手段。业务影响分析:明确业务应用系统中断所产生的潜在影响,包括可量化的影响和无形的影响;通过评估,定义关键业务的影 响并制定出优先级;为制定容灾策略提供依据。容灾系统需求分析:进行主机配置需求分析、存储需求分析和SAN结构的需求分析。

容灾存储解决方案

惠普为广州供电局提供HP StorageWorks企业虚拟磁盘阵列(EVA)系列,以实现基于服务器的存储容灾。作为高性能、高容量、高可用的"虚拟"磁盘阵列存储解决方案。 EVA系列采用惠普独有的Versastor存储虚拟化技术,可以消除传统存储设计中时间、空间和成本等方面的限制,为高端企业用户提供"虚拟"RAID 存储解决方案,可为用户带来更高的系统利用率、更低的管理成本、更高的系统可用性。其"自我协调"性能可以实现自动化的数据分摊、灵活的配置和对容量或者 性能的最佳化,系统管理员不再需要关注数据的位置,从而使用户真正地远离存储的物理设备,这一转变大大简化了存储的管理和培训工作。

同城集群解决方案

惠普远程集群解决方案包括本地MC/SG集群、同城集群、城际集群、洲际集群等。其中,本地MC/SG集群可以应对系统故障、软件错误、人 为失误;同城集群可以应对火灾、建筑物损坏、盗窃等;城际集群可以避免闪电、恐怖袭击、病毒攻击等;洲际集群可以应对火山爆发、地震、水灾等。

图:惠普全程应用容灾解决方案

广州供电局采用HP MetroClusters 支持同城集群,可以实现主备中心自动切换或半自动快速切换,减少因为手工切换导致切换时间长或操作出错,或由于操作人员无法及时到位导致的系统无法及时切换。

数据迁移服务

惠普数据迁移服务的总体流程,包括数据收集、方案设计、方案测试、具体实施等步骤。在数据迁移实施过程中,惠普根据具体情况结合采用主机DD复制等方式,为广州供电局实施数据迁移,并满足广州供电局对停机时间和数据完整性一致性的要求。

惠普数据迁移总体方案包括:数据迁移方法、数据恢复方法及步骤;系统的数据文件清单;需迁移的系统中数据库物理结构、逻辑结构、数据之间的逻辑关系;制定《数据移植的实施方案》;制定《数据迁移风险应对方案》。

灾难恢复计划及演习

在灾难恢复计划的开发阶段,通过惠普容灾顾问的咨询服务,广州供电局信息部成立了灾难恢复管理团队,制定了在发生计算机系统故障或灾难事件 时,为了尽可能减少损失,所需要采取的抢救措施、故障隔离措施、系统恢复步骤和方法等;同时定义了灾难恢复所需的人员和资源、以及灾难发生时与各关键业务 部门人员的紧急联系方式等;并定义了灾难恢复计划的测试和维护方法。从而保证当出现重大的灾难时能够有序地、及时地恢复IT服务。

在制定了灾难恢复计划后,惠普与广州供电局共同举行了灾难恢复预演,随后项目组对预演进行了总结,并根据预演的情况,补充完善了灾难恢复计划。

客户受益

通过项目的成功实施,广州供电局信息中心建立了完善的数据中心灾难恢复应急体系,实现了人员、流程和技术的紧密结合,大大提高了信息中心的应急处理能力,保障了关键业务的持续运行,从而成为中国电力行业IT容灾系统和应急体系建设的标杆。

  • 保障数据的可用性和完整性
    基于智能存储阵列数据复制的容灾体系,实现了主/备数据中心数据的实时同步,最大限度的保证了主/备中心数据的完整性和可靠性。
  • 实现了IT系统的高可用性,达到应用级的容灾水平
    实现了全面的容灾系统,包括:网络系统、网络基础系统、主机、存储、数据库和应用系统,达到业界领先的应用级容灾水平。当主数据中心由于各种意外灾难导致主数据中心崩溃时,备份中心的系统可以全部接管主中心的工作,在短时间内恢复业务的运行。
  • 实现容灾技术、流程和人员的紧密结合
    开发了广州供电局信息部灾难恢复计划,组建了灾难恢复管理团队和执行团队,制定了灾难恢复流程,包括信息安全和网络灾难恢复操作手册、系统和数据库灾难恢 复操作手册、后勤保障灾难恢复操作手册、数据中心运维灾难恢复操作手册、灾难恢复用户联络操作手册等,从而实现了容灾技术、灾难恢复流程和灾难恢复人员三 者的紧密结合。
  • 具备抗灾、防灾能力,保障业务持续性
    对重大灾难事件,具备在可接受的时间范围内在备份中心恢复应用系统的能力,能通过可控、有序的方式进行IT服务的灾难恢复工作。减少了突发的灾难事件对业务所造成的中断时间,从而实现了更高程度的业务持续性,把意外灾难对企业业务的影响减少到最低程度。

广州供电局数据容灾备用与应急处理中心的建设项目荣获了"中国南方电网科技进步二等奖"、"广东电网科技进步一等奖"、"广州供电局科技进步一等奖"等荣誉。

客户评价

"在本项目中,惠普容灾项目实施团队以严谨高效的工作作风,为广州供电局进行了容灾技术体系的规划和实施,并提供了灾难恢复计划的咨询服 务,通过项目的实施,广州供电局信息中心建立了完善的数据中心灾难恢复应急体系,实现了人员、流程和技术的紧密结合,大大提高了信息中心的应急处理能力, 保障了关键业务的持续运行。"