确保灾难恢复系统的可靠性至关重要

DoSTOR存储在线–英国东北公用事业是新英格兰最大的公用事业公司,电力与天然气用户数量超过了200万人。 该公司的正常运作对IT的依赖比较重,它必须确保灾难恢复做到万无一失。

显然,东北公用事业公司的灾难恢复计划和测试都是严格按照规程进行的。然而,尽管该公司的灾难恢复计划具有极高的可靠性,但是仍可能出现一些无法预料的小问题,使到公司在遭遇灾难时无法顺利恢复。

老实说,任何隔离或模拟灾难恢复测试和演习都不能取代定期人工测试灾难恢复系统。甚至在这种情况下,许多制定了最佳灾难恢复计划的公用事业公司仍需要经常性更新、增加和修改复杂的IT基础设施。

东北公用事业的业务连续性和灾难恢复调度员Ed Goldberg称,灾难恢复测试所得到的资料并不能适用于很多地方。他说:“实际上,没人会把那些资料当回事。”

在一次偶然的业界贸易会上,Goldberg结识了Continuity Software公司并同意让该公司测试扫描一下东北公用事业的RecoverGuard产品。

据Continuity Software称,RecoverGuard是一个无代理的企业监控软件解决方案,它可以不断扫描公司的IT基础设施,包括存储设备、数据库、服务器和复制结构等,还可以检测出数据保护系统中的风险和漏洞。

Goldberg说:“我们花了一点点钱,用了几天的时间进行了一次测试扫描,Continuity Software向我们保证,他们肯定可以找出利用率不高的存储设备。”

东北公用事业的IT基础设施包括主机、传统遗留的系统、600台到800台Windows和Unix服务器(其中有些已经被虚拟化)、甲骨文、微软 SQL Server和Sybase数据库以及现代控制系统。还有许多支持和保护公司所有业务服务的数据中心。 目前的存储空间大约为0.5PB,每过18个月增长一倍。

发现问题

RecoverGuard用了几个小时的时间扫描了东北公用事业的部分服务器,Goldberg说:“我们被告知了一些我们以前不知道的东西。”

Goldberg被说服了。

他说:“这款产品的价值就在于它可以发现我们漏掉的东西。”

RecoverGuard可以从关键技术元素中收集资料,建立一个详细的灾难恢复环境布置图,然后监测环境,及时发现漏洞和风险,跟踪系统的变化,以及通过检测次优配置和未充分使用的存储资源来优化基础设施。

RecoverGuard在夜间对公司的开放系统灾难恢复环境进行扫描,以确保不会在无意中造成结构性变化而影响到系统的可恢复性。

Goldberg说:“对我们来说,它就象是在我们做事时进行第三方确认一样。”他非常相信这个解决方案的可靠性。

Enterprise Strategy Group的分析师Bob Laliberte称,确保灾难恢复点随时可将所有系统恢复,这一点非常重要。因此,RecoverGuard是一款很有价值的工具。

专家服务

东北公用事业没有采用购买软件许可证自己运行产品的方式,而是将RecoverGuard和 DR Assurance作为包年服务的方式购买下来。Continuity Software的DR Assurance结合了RecoverGuard软件的功能及其DR专家的专业知识,那些DR专家可以提醒用户注意各种问题和解决方案。

Continuity Software的产品目前扫描了东北公用事业的64台服务器,其中有些服务器是虚拟服务器。Goldberg说:“我们所有的重要服务器都处于扫描范围之内。”

这项服务不会影响到东北公用事业的IT环境的性能。他说:“我希望以后我可以用它来扫描我们的主机环境,但是这款产品现在还无法做到这一点。”