4个步骤教你如何重复利用旧虚拟化主机

VMware ESX 3.0已经发布了三年多时间,目前有很多用户希望升级到VMware最新的vSphere 4.0虚拟化平台,而大量运行ESX 3.0的服务器也到了需要更新换代的时刻。这些运行了三年ESX 3.0的老旧服务器虽然已经不能完全满足未来快速增长的负载需求,但还是具有不小的性能空间,将这一大批当时非常昂贵的服务器关闭弃之不用,确实显得有些浪费。为了不将老旧的虚拟化主机丢弃在角落,很多企业也在重新利用这些服务器,有些企业将它们建立集群,分担部分业务负载;而有的企业将这些旧服务器用于测试或者培训应用。

假如你拥有多个办公室或者一个大型的校园,建立一个热备站点需要利用大量的硬件,这需要大笔的花费。这时这些替换下来的老旧服务器就可以帮你节省成本了,将这些服务器用于热备站点,即使不能承担百分百的负载,但是在一些状况下聊胜于无–可以在新服务器出现故障,或者更换硬件的时候作为后备暂时负担起业务,避免业务的间断。

那么,下面我们就来看看怎么样给你的新虚拟化主机做个热备站点吧。

步骤1:定义服务级别

首先,你需要定义你的热备站点的服务级别,是希望保护所有站点内所有服务器还是部分?你需要多短的故障恢复时间?你需要恢复什么时候的数据?这些问题的答案将影响你的架构设计过程,不同的服务级别也影响着硬件上的花费。一个热备站点上的所需要的花费可能要比你现在能承受的要多,这种情况下最好节省你的开支,精确的进行投入,而不是花钱在没用的事情上。

步骤2:规划SAN配置

SAN是第一个需要关注的硬件部分,因为这几乎是最昂贵的部分了。如果可能的话,在部署一个热备站点的时候最好采用SAN-to-SAN的异步复制(asynchronous replication),但依赖于所使用的SAN平台,这种复制方式可能不能实现,或者并不经济。举例来说,如果你的Web站点运行的是没有iSCSI 连接的FC SAN,并且没有暗光纤(dark fiber),在没有特定硬件如FCIP网关或软件如EMC的RepliStor情况下是不能实现SAN复制的。如果你是这样的情况,以后升级或者替换 SAN的时候一定要考虑这些因素。另一方面,对于采用一些设备品牌的用户还有一些问题需要注意,如NetApp用户应该添加更多的SnapMirror许可证。

如果不能执行SAN到SAN的复制,你也有一些其它的选择。现在有一些很好的基于主机的复制软件包,可以运行在ESX主机,实现主机到主机的直接复制,包括Vizioncore vReplicator和 NSI DoubleTake等,但注意其许可证是每虚拟机而不是每主机。还有需要注意的是用老主机做热备的时候需要给它们连接大量的存储,因为如果这些老主机连接到了SAN,就不再有自己的硬盘。

不管你打算怎么去做,无论是SAN还是基于主机的复制,存储配置的设计是热备站点最重要的一个部分,需要仔细的进行考虑。

步骤3:计算带宽需求

选定好为你的热备站点采用哪种存储方式后,你需要考虑如何传输数据。如果你的热备站点是通过光纤连接,那么就不需要太担心带宽问题,除非数据非常之巨大。但是对带宽的计算是非常重要的,因为长期来看不正确的带宽计算所带来的额外费用也是非常巨大的。比如,最初你设想有两条T1线路(3.0Mbps)就可以满足每24小时约25GB的数据备份,但是实际应用中你发现每天需要复制的数据要有35GB左右,这几乎和预想的要差一条T1线路的带宽。不要小看这些看似细小的差别,在三年时间中这些带宽的租用费用可能和一个新的SAN或数台虚拟主机的费用一样多。

所以计算复制带宽需求是非常重要的,需要通过一个可靠的方式进行计算。一个最简单的方法是采用 VMware内建的snapshot功能,为你需要备份的虚拟机建立一个snapshot,等待一个复制周期,然后在你的VMFS卷上检查 snapshot文件的大小,这个数字可以粗略计算出在这个周期内虚拟机变化的数据量。当然,这个方法也可以计算不同时间段里虚拟机数据的变化。

但是,根据SAN平台的不同,SAN复制的数据块可能要比VMware的snapshot文件要大,虚拟机中一个1KB的文件存储到SAN中可能要变成16MB,放大了16000倍。不过这种情况也很少出现,这说明也不能完全根据snapshot文件来估算实际的复制数据量。

为解决这种问题,并增加WAN链路的传输能力,采用带有重复数据删除的WAN加速器是个明智的选择,比如采用Cisco的WAAS或者Riverbed的Steelhead等等。这两个平台具有各自的优势和不足,但是本质是相同的,可以只能优化WAN数据流并具有不少其他的TCP增强特性,并可以为之前的WAN连接保留远程缓存,能够解决从1KB数据变成16MB数据的问题。

步骤4:明确虚拟化软件的许可证需求

最后一个需要考虑的是你的热备站点需要多少的虚拟化许可证。当然,你可以在没有许可证的情况下配置一台 ESX主机,在活动站点失效时把许可证迁移到这台主机。另一个方法是购买VMware vSphere Essentials的许可证,虽然特性上相比你的活动站点有一些限制,但是也可以启动和运行虚拟机。

另一个问题是考虑你是否需要部署VMware的Site Recovery Manager,SRM要求进行SAN到SAN的复制,并且价格不便宜。尽管如此,如果需要经常检查你的恢复计划或者需要一个完全自动的数据恢复过程,部署SRM还是非常有必要的。

重新利用老旧硬件是个好想法

利用老旧硬件建议一个用于热备的数据中心是重复利用资源的一个好方法,但是盲目的建立热备站点,不考虑你有多少富余的硬件可以利用,也不会取得很好的效果。记住这几件事情:制定合适的目标、考虑存储资源、仔细估算WAN带宽、考虑软件许可证的限制,可以有效地降低成本,并实现效率的最大化。

随着技术的发展,今天的虚拟化技术、不断更新的存储技术和网络技术,让建立一个实时在线的容错系统也并不是什么难题,如果你需要高可用性的系统,那么现在也是该动手的时候了。