服务器在线9月9日报道 提高虚拟服务器的灾难恢复能力,这是打造企业虚拟化平台的核心环节之一,但是直至今日,供应商仍未将这一产品改进计划提上日程。因为对大部分供应商而言,减少服务器蔓延、减少资本投入、开展绿色行动更有吸引力和并可带来实际效益。灾难指的是火灾、洪灾、瘟疫,这些灾难并非是由用户失误或文件删除而造成,但需要进行数据恢复。
大部分企业都在实施每日数据保护计划;少部分企业则有相关政策、资金支持以及完善的SAS 70审计制度,这样就可确保灾难恢复战略的全面性,使得其不仅仅由闲置硬件、粗略的测试和陈旧的运行手册构成。
当前,基于虚拟化技术的灾难恢复系统已经出台。我们可以看到已经上市的产品,如Vmware公司的Site Recovery Manager。Citrix XenServer Enterprise、有Live Migration功能的Platinum、以及我们用作测试的Microsoft Hyper-V,这都显示出,在内存容量足够的情况下,将虚拟机转换到新的主机服务器上是没有任何问题的。其他的供应商也发布了相关产品或将现有产品进行了改进,以赶上这波虚拟灾难恢复系统的浪潮,例如Novell的PlateSpin Forge和Double-Take Software软件。
或许你会问:这一浪潮存在吗?对近期的50个虚拟化项目进行回顾则可以发现,90%对企业主系统实施虚拟化的客户也计划对企业灾难恢复系统实施虚拟化。
一个有趣的现象是:部分企业对灾难恢复系统实施了虚拟化,却未将主网络虚拟化。虚拟化技术的狂热者或许会嘲讽这些人,但是这一趋势却说明了很多问题。灾难系统虚拟化所花费的资金远远少于建立一个标准灾难恢复中心。并且实施虚拟化、建立系统内部设置这一过程不会影响生产系统的正常运行。
一个中等规模的私立学校Rhode Island采用了这一方式。在灾难发生后,IT部门选择采用虚拟化设备,而不是将生产网络虚拟化来填补灾难恢复系统的空白。学校新创建的会计软件尚不能在虚拟环境中运行。但这一软件最终可在虚拟机上实现运行,并可进一步将其安装在灾难恢复中心。当供应商增加了虚拟系统支持后,学校的灾难恢复系统水平上升到了一个新台阶。
对于已经实施服务器虚拟化的公司,需要考虑的主要问题是灾难恢复中心结构的规模和故障转移水平。如果你刚开始部署虚拟化,你会发现这样可以节约很多资金(当然,企业的财务主管很快就会发现资金结余,并会重新安排预算),同时很多设备处于闲置状态。假如你的企业有275台服务器,运行在30个物理主机上,SAN上存储了10 TB的数据,企业的灾难恢复中心规模该如何确定?是否应该减少服务器数目以节约资金?
事实上你无法做出决定。这一决定必须由企业高层来做。将灾难恢复计划书递还给企业CEO和COO,同时说明当前的产品利用率。这是决定企业灾难恢复系统带宽、主机服务器数目和存储结构的关键因素。
任何的灾难恢复计划都需要定义紧急任务系统访问参数。一个依靠IT系统进行后台支持的制造公司或建筑公司或许会构建灾难恢复中心,以保证设备的一般使用率和工作量,同时给予部门主管或核心应用软件优先权。如果系统中是面向用户的后台数据,你则希望使系统结构和连接带宽相匹配。
如果你的企业灾难恢复系统规模过小怎么办?实施虚拟化和采用SAN usage的最大好处就在于可迅速扩展对硬件系统的支持。假设你有一个十结点的主机服务器群组,在灾难发生时,其中的五台服务器可用于支持灾难恢复中心。你需要制订的计划是:在失效备份时间超过48小时的情况下,你需要增加主机服务器来提高效率并分散负载,你如何提供更多的技术支持。
变不可能为可能
无论你运行的是Citrix、Microsoft操作系统、Sun Microsystems、Vmware操作系统还是Joe的开放源码系统,只要你进行了服务器虚拟化,就有低成本实施灾难恢复计划的可能。将物理服务器、逻辑服务器和应用软件分开说明了企业CIO所希望看到的最终结果,我们将其称为数据丢失量(RPOs)和恢复时间(RTOs)。计算并定义企业主要数据块的RPOs和RTOs是制订整体灾难恢复计划的第一步,这与制订每日的备份、复制和存档程序同样重要。决定该构建何种系统取决于可接受的恢复时间和数据损失量。这一计划过程不但提高了对灾难系统的关注度,并且可证明构建这一系统的资金支出没有白费。
下一步,你需要制订数据复制或备份系统的计划,这一子系统将整合进企业虚拟系统。虚拟化是针对服务器和应用软件而不是针对数据。如果你已经实施了服务器虚拟化,但却没有存储区域网络,那么系统的复制和快照功能必然不完整,但这两项功能是灾难恢复战略所的重要组成部分。最后,确保企业当前的备份或连续数据保护软件可支持虚拟备份、数据复制和远程存储。这一子系统的主要供应商包括CA、赛门铁克以及Tivoli,这些供应商都扩展或改进了产品线,目的是提高产品的虚拟数据保护功能。
放手去干
虚拟灾难恢复环境有四种:冷储备、远程站点、热站点和非虚拟化办公室。
冷储备是最常见的。将原始数据存储在磁带中、放置在远离办公室的地方。尽管在出现灾难时,你必须重建系统,存储数据,并让一切归位,但不要止步于此。除了进行数据存储,备份磁带也应该包括相关的虚拟机。我们看到用户对其基础虚拟服务器中的数据进行复制,然后存放在灾难备份中心,最后关闭电源。数据库和数据流的更新方式为将其复制或转存到灾难恢复中心。失效备份应该包括导入虚拟服务器和重新存储磁带或磁盘上的相关数据两个程序。
东北地区一个中等规模的发行公司很好地利用了闲置设备(虚拟化工程实施,冷储备服务器的构建导致的部分设备闲置)。与一般的磁带更换不同,企业利用由于虚拟化的开展而闲置的服务器构建了一个小型企业网络。这一网络采用了公司核心虚拟机,之后将其关闭并运送到其他地方。数据磁带仍正常运转,但公司把服务器图像每年的升级次数增加到了两次。由于这一项目采用的服务器是闲置设备,因此成本的增加仅限于增加内存、结构配置和许可证费用。很多公司将远程办公室视为灾难恢复中心,这样就可利用现有基础设施和telco资金。例如,纽约的一家投资公司采用了Vmware虚拟系统和CA公司的XO Soft复制软件,将这一软件用于服务器数据复制,而核心数据则采用EqualLogic SAN阵列进行复制,这样就对公司基于虚拟系统和存储项目的灾难恢复计划进行了更新。结果怎样呢?
公司的IT主管说,”不需要将数据转移到一个托管网站就创建一个完善的失效备份系统。系统可复制所有的核心数据,并可将冗余数据放置在Domino邮件系统中。”
如果你继续开展这一灾难恢复战略,下一步需要关注的是带宽。一家金融公司办公室之间为100-Mbps的带宽连接,其仅在正常工作时间打开。这使得IT系统有大量时间进行备份和升级。如果你在站点间用管道进行连接,一晚上时间别想复制几十亿字节的数据。从理论上说,一个仅用于数据传输的T1每小时传输量为550 MB到650 MB,但这是最优运行状态。当传输不同类型的数据,并且还需要预留错误数据的存储空间,一晚上能传输的数据量就只有40 GB左右。
贸易公司、特别是金融公司及其他”挥金如土”的公司一般可采用热站点来进行灾难备份。灾难备份中心的规模和公司上层对RPO及RTO要求有直接关系。如果要求为:恢复点是零数据损失,恢复时间要少于10分钟,那么你可以考虑进行所有水平的投资,从带宽(光纤是必备的)到复制(特别是失效转移和数据复制以及数据库和邮件专用软件)。我们认为Vmware的Site Recovery Manager软件包非常适用于这种水平下的系统构建。这一产品是去年发布的,包含了构建一个灾难备份中心的所有程序。这一产品不是复制系统,因此你仍需要采用SAN的复制功能或者第三方产品(如CA公司的XO Soft或Double-Take)来复制数据。但只要系统出现中断,SRM就开始接收数据,还可管理两地之间的服务器中断。这一系统甚至有根据计划编制大略的灾难恢复系统运行报告的功能,审计师很喜欢这一功能。局限性在于:仅对Vmware服务器进行了虚拟化;当前不支持SAN上的原始数据LUN复制。
从基础开始
对于尚未开展虚拟化、但希望采用虚拟化技术进行灾难备份的企业,部分供应商提供了开展相关工作的工具,这一产品可提高虚拟化水平和平价存储器,用以构建成本相对较低的灾难恢复系统。PlateSpin的Forge就是这样的设备,这一设备可构建系统产品的镜像,因此非常流行。这一系统构建在Vmware虚拟引擎上,改进了PlateSpin的转换功能和恢复软件。产品有两个型号,可支持10或25台服务器。可支持25台服务器的型号价格为50,000美元,貌似价格不低,但是这一产品包括2.5 TB的存储器和16 GB的RAM,以及所有的虚拟化许可证,并同时支持虚拟化和非虚拟化服务器。为进行虚拟化的服务器必须用PlateSpin的转换器进行重构,这需要改变部分设置。
警告:在高峰时段,设备仅支持Windows操作系统的服务器。然而,由于近期Novell收购了PlateSpin,预计不久也将支持Linux操作系统,甚至可以实现对NetWare服务器的利用。其次,带宽和速度并未提高,还有,PlateSpin不复制所有SAN存储器或数据库中的数据。Zenith Infotech提供了一款类似的产品,这一产品构建在Sun公司的虚拟技术上,但也存在类似PlateSpin产品在操作系统和SAN支持方面的局限性。
资本核算
资金投入是前提,我们先实施灾难恢复中心虚拟化,继而将其标准化为30台服务器和4TB存储量,目的是进行成本对比。Lion的资本节约来自于服务器。标准设置中,核心设备的镜像系统所需硬件和核心系统相同,这就需要多支出150,000美元。在一个虚拟化环境中,我们采用了更大规模的服务器和附加内存及处理器,目的是将十台服务器整合到一台上,这一过程中支出为30,000美元,净结余120,000美元。我们计算了软件许可证的费用:标准版本为100,000美元,虚拟化版本为120,000美元,这一费用包括核心许可证及虚拟化软件和相关备份软件的费用。存储容量的费用不确定。我们假设标准结构的价格为40,000美元,虚拟版本的价格翻番(因为需要增加物理到虚拟转换的费用和创建最新升级计划的费用)。即使没有长期效用,由于服务器减少所带来的资金结余也仅有这些,我们的示例系统仍比标准的灾难恢复系统的支出少60,000美元。