DoSTOR存储分析 寻找一种低成本容灾解决方案

DoSTOR存储分析–纵观人类历史,人们一般都是在吃亏了以后才会看到自卫艺术的价值。这一点在灾难恢复上尤其如此。在诸如9/11事件、卡特丽娜飓风,或最近的洪水和龙卷风之后,厂商们的灾难恢复设备就马上得到比起以往多得多的关注。

IBM的信息保护服务部门的Brian Regan说:"当一个事件发生时,我们就看到客户们的兴趣马上增加,然后促使我们和我们的客户之间更多的交流"。

美国海洋与大气总署(NOAA)最近的警告说预计将有一个正常或接近正常的飓风季节,但是这种警告显然不会马上促使企业关注购买最新水平的业务连续性(BC)配置,虽然在卡特丽娜飓风的结果之后他们才开始关注。最近的一份Aberdeen Group的研究报告显示34%的公司还没有部署任何灾难恢复解决方案。在剩下的66%中,25%没有进行定期的灾难计划测试。而且,当你看中小型企业的时候,Aberdeen Group的分析师Jeffrey Hill报告说在雇员在100到1000之间的中小型企业中,接近一半的企业没有业务连续或灾难恢复计划。

是成本还是过于自信?

这种情况并不是完全因为过于自信。许多公司希望能在灾难面前能够马上恢复。但是他们无法承受这个成本。比如说你希望设置一个大型的备份/恢复架构,例如Saleforce.com所使用的那样。Saleforce的备份和灾难恢复平台可以让它在无论什么时候都不会丢失任何交易。但是这需要总共9个备份的数据,每个备份都有不同的灾难恢复点。该公司复杂的磁带库阵列、磁盘阵列、服务器和数据库花费了大约2000万美元的成本。通过对分布在不同海岸的镜像SAN(存储局域网)之间的生产数据进行定期的影子镜像,实现了连续数据保护(CDP)。Oracle数据库也被连续地保护。该公司部署的其他情境包括从始至终都可以在4小时内恢复到不重要系统在48小时内恢复。

当然,不是所有人都需要这种层次的保护。因此,发展出了不同水平的灾难恢复,其范围从"保持生存或者死亡"这种类型的灾难恢复,到更为具有优先次序的方法,一直到经济型的灾难恢复。

让我们来看看基本的灾难恢复–某种类型的定期备份,和在合理时间内恢复系统及数据的计划。区分这两个很重要。

Hill说:"一般一个公司都会有一个数据备份系统,但是仅仅只是备份数据不会构成灾难恢复策略"。

但是,正如Aberdeen的数据所证明的那样,许多公司没有走出备份的范畴来建立某种形式的灾难恢复方案。而另一个极端是,一些公司由于受够了备份技术之间的争战,以至于他们就部署了灾难恢复而没有部署任何形式的底层备份。

例如,纽约城的消费者事务部使用来自Brocade的StorageX来专门用于灾难恢复。它在曼哈顿的主要办公室则是在一个EMC Celerra NS500 NAS(网络附加存储)设备上存储数据。它在皇后区的其他主要站点则使用另一个NAS设备。在皇后区的用户实际上将数据写入EMC设备,然后曼哈顿的所有数据都通过微软DFS(分布式文件系统)被复制到皇后区。Brocade StorageX将文件数据汇总到一个逻辑文件系统。如果曼哈顿发生故障,那么用户可以自动切换到皇后区。

它们的IT部门是如此自信,以至于它如此进行最终测试–在一个工作日当中拔下EMC设备的电源。更让人惊讶的是,这个部门甚至不使用定期备份系统。它就依赖于这种灾难恢复设置来保护它的所有数据。

"当我们进行测试时,一切都很完美",该部门的LAN(局域网)管理者Matthew Miller说,"这个系统在第二个地点就故障复原了,而用户感觉不到任何事情"。

地堡心理

Pella Corporation是另一端的代表。它是一家位于艾奥瓦州的生产窗户和门的公司。它的业务运行在Oracle E-Business Suite应用程序和Oracle Database 10g上,并使用一个集中式的架构。它同时还部署了一个名为地堡的用于恢复的远程数据中心。

Pella的IT运营总监Jim Thomas说:"在地堡之前,我们用很多设备来防备组件故障,还有文件化的计划来防备站点灾难,但是如果我们连数据中心都丢失了,那么这种恢复过程将很漫长"。

惠普提供了它的StorageWorks XP24000阵列,在两个数据中心都部署一个。这两个系统通过光纤通道互相连接,能够在两个地点之间进行连续的复制。地堡被加强到可以防备龙卷风,而且如果主数据中心被摧毁,它还可以运行所有的关键系统。

建立这个系统花了好几年,投入了几百万美元。当是你并不一定需要花费这种数量级的成本来保护你的系统。位于孟菲斯的Lipscomb & Pitts Insurance LLC保险公司就走了设备路线。这种类型的解决方案特别适合中小型企业,或那些手头资金短缺的组织,对于那些不希望引入更多灾难恢复/存储复杂性的大型组织来说也很合适。

Lipscomb & Pitts购买了Colorado Springs公司的STORServer。该公司的财务副总裁Mike Yates说这个举动是因为一个特别的事件。

"你不知道灾难会何时发生,因此你必须做好偶然情况下的安排",他说,"如果你丢失了你的数据,那么你的业务就必须停止,然后你就不能为你的客户进行服务"。

这家100人的公司使用了一个来自希捷公司的EVault InfoStage和EVault InfoStage DualVault的组合,所有这些系统都通过masterIT来操作。masterIT是一家田纳西州的IT托管服务公司。它对Lipscomb & Pitts的备份/恢复以及IT操作进行管理。每个晚上都会备份超过250GB的数据。

Yates说地堡式数据中心、大量的自动化磁带库以及昂贵的复制设备对于大型企业来说是很合适,但是对于许多中小型企业来说就是可望不可及了。

"相对于那种成本,我们不需要花费太多的成本就可以做好灾难恢复准备",他说,"数据每天都被发送到不同的地点,而且还是以一种对我们的员工透明的方式来进行,这一点很让人欣慰"。

没时间可以浪费了

在灾难恢复上,市场上有许多不同的策略和技术可以使用,每种策略和技术都有不同的价格水平。客户经常是根据不同的恢复点目标(RPO)和恢复时间目标(RTO)所需要的成本来作出抉择。

"如果你拥有无限的预算和资源,那么你就可以选择一个零或接近于零的RTO和RPO",StorageIO Group的创始人兼高级分析师Greg Schulz说,"但是在许多现实环境下,如果你能够针对威胁因素部署正确的保护层次,那么你就是在最大化你的预算和开支回报"。

Schulz建议中小型企业在预算范围内对关键性的和时间敏感性的材料实行最低的RTO/RPO保护,然后对其他数据使用不同的RPO和RTO保护。

但是,无论是需要什么样的灾难恢复方案,都必须尽快部署灾难恢复方案。

Aberdeen的Hill说:"中小型企业不能等到足以让公司停止运作的灾难发生后才去分配资源部署灾难恢复方案"。