灾备即服务:如何低成本构建容灾环境

灾备有多重要

灾备有多重要?有统计数据表明:93%的企业,一旦发生数据中心失效达 10 天的情况,通常在一年内就会破产。

灾难的发生往往是出乎人们意料的,当突然发生大的灾难,日常建立的控制措施已不再有效时,组织如何才能保护核心业务不被中断,使灾难的造成的风险降到最低呢?这正是灾难恢复需要考虑的问题。

数据中心的灾难会以不同形式发生,比如电力中断、硬件故障、人为操作失误、以及自然灾害。大量的事例表明,业务中断不是“假如”的问题,而是“何时”的问题。因此,只要是拥有IT信息系统的组织,都应为随时可能发生的中断作好准备。保证业务连续性也就是确保业务连续运作,不管发生什么情况,重要的系统和网络必须具有不间断的可用性。

传统灾备方案面临的挑战

图片2.jpg

传统的灾难恢复计划依赖于一套非常复杂的流程和基础架构:复制数据中心、复制服务器基础架构、将数据转移到恢复站点的流程、重启服务器的流程、重新安装操作系统的流程等等。由于灾难恢复可能非常复杂,而且成本非常高昂,因此各个企业常常发现他们只能为少数几个重要的生产工作负载提供良好的保护,而其他的工作负载则得不到保护或者保护的不充分。

当前数据中心现代化已经发展到高级阶段,信息化系统越来越复杂,可用性要求越来越高、数据增长越来越多。因此,保护IT资源,确保可用性,并且在发生意外灾难的情况下能按计划快速恢复运营,这是企业IT领导者今天的重中之重。无论企业是否准备好、是否进行灾难恢复测试,都会面临着发生灾难的风险。在传统IT架构中,为了减轻这些风险,企业需要搭建灾备系统,依赖高昂的软硬件投入、灾备系统间宿舍、灾备流程规划来实现,但自建灾备系统在成本高昂的同事,也面临着资源利用率低、难以做演练、缺乏专业团队支持等障碍。

首云灾备即服务(DRaaS)

云计算时代,多租户、即付即用、弹性扩展、按需付费的云服务模式恰好能解决当前企业灾备的困境。云服务提供商负责构建灾备云,企业直接接入可靠的灾备服务,按需付费,不需要新的资本支出,并且易于进行灾备演练测试自助服务。企业IT领导者越来越多地将基于云的灾难恢复服务(DRaaS)作为对其高可用性和灾难准备目标的简单而经济的解决方案。

首都在线的混合云服务,提供基于VMware虚拟化底层的云灾备解决方案,为企业级客户提供架构简单、成本合理的多租户按需灾备和数据迁移服务,支持客户现有vSphere私有云环境、首都在线托管私有云环境、首都在线灾备云环境三者间的无缝兼容。

图片3.jpg

VMware有着成熟的灾备技术和企业级应用案例,但之前的企业级产品是Site Recovery Manager(SRM),SRM可选基于阵列的复制技术,支持实时性很高的Tier1应用系统,但通过公有云,网络带宽的瓶颈会极大削弱阵列的复制能力,并且与客户私有云环境资源是1:1的对应关系,不支持多租户按需灾备的场景,会提高灾备云的成本。因此,通过VCAV技术,非常适合对业务灾备实时性要求从数分钟到数小时的Tier2-Tier4业务系统,通过多租户的形式提供,这是当前市场上基于Vmware架构的较简单、较经济的差异化灾备解决方案。云灾备方案 以每台虚拟机每月的粒度计费与结算。

该方案部署简单,易于操作,在客户原有的vSphere私有云环境或首都在线托管私有云环境中,部署VReplication免费插件,即可实现与云端灾备环境的连接,不改变客户私有云的架构与配置。通过私有化部署的HCMS混合云管理平台,企业可实现混合云多个环境之间的资源统一管理调度和灾备、迁移操作场景。不需要对企业原有IT环境做大规模改造,也就节省了相应而生的高额成本,实现了贴近于公有云体验的灾备服务灵活开通、按需支付。

业务场景

多租户灾备场景

在云时代企业及客户期望私有云可以无缝灾备到公有云,但对于云提供商来说为每个客户建造一套专用环境显然不算经济,效率和运维也是大难题,因此灾备云的核心业务场景就是支持多租户的灾备,不同的租户有不同的备份策略、备份目标,支持从5分钟到24小时的RPO,灵活可调。当客户数据中心vSphere环境由于各种原因导致的IT基础设施崩溃、数据丢失时,可以快速从灾备云中恢复。

图片4.jpg

混合云数据迁移

当前,混合云是客户IT的热点关注方向,混合云实现了客户私有云环境与公有云环境的衔接,实现了统一管理、灵活扩展部署和网络延伸等功能。但是作为混合云的第一个环节就是数据迁移,把客户的工作负载从私有云迁移到公有云,这个过程既包括了虚拟机的迁移,也涵盖了网络的衔接,为了保持迁移过程的顺畅并减少宕机时间需要有专用工具来实现。HCMS基于VCAV的复制和迁移工具,恰好能满足客户做混合云的数据迁移需求。

图片5.jpg

超越灾难恢复:灾难规避和计划内迁移

云灾备解决方案不仅限于进行灾难故障切换,它更常用于日常迁移,例如用于灾难规避和计划内迁移。当然,灾难故障切换是最重要的使用情形,也就是当一个站点停止工作并且需要尽快将虚拟机迁移到辅助站点的时候使用。在这种情况下,云灾备系统可支持完全或局部站点恢复,并将尽快执行故障切换以恢复业务服务。

其他两种使用情形尽管不是那么重要,但却更为常用。灾难规避在企业事先了解灾难将要发生的时候使用,例如,预测到飓风或洪水将要来袭时。在这种情况下,企业一般可在灾难实际来袭之前提早至少几个小时得到通知。企业也经常执行计划内迁移,例如,避免因计划内维护或全局负载平衡而导致停机。对于灾难规避和计划内迁移,现在企业可利用“计划内迁移”工作流程和自动故障恢复来简化迁移流程。

图片6.jpg

云时代的企业灾备方案提供商

首都在线云灾备系统 可降低管理和测试的运营成本,并且能够显著降低设置和维 护恢复计划所需的人员开销。它用简单、集中化的恢复计划(定期更新所需的时间和协调工作要少很多)替代了复杂的人工操作手册,实现了这一目的。除了灾难恢复实施外,IT 部门通常在正常工作时间以外的时间进行灾难恢复测试。HCMS实现了自动化、无中断的灾难恢复测试, 从而减少了此类做法的成本。

以虚拟机为粒度的云端灾备解决方案,可以为客户节省传统灾备方案中灾备环境高额的软硬件置备成本和灾备数据中心建设成本。真正实现了以公有云弹性按需的方式使用云端灾备资源。为企业提供了灵活便捷、成本低廉的灾备解决方案。

了解更多方案信息,可加微信CDS首云(微信号cds_service)索取,或点击阅读原文填写信息索取。