怎样建立一个完整的灾难备份系统

就像我们看到的东北部的桑迪飓风和西部海岸的风暴一样,自然灾害无论何时何地都有可能发生。即时我们事先获知这些即将到来的事件,我们也没有办法预测什么时候会因为人为失误或恶意行为而发生IT问题。

谁能预测就因为没喝一杯咖啡就让管理员在服务器上按下错误的按钮或一个清洁工偶尔拔掉一台服务器的线来清扫数据中心?当然,作为服务提供商,你可能会因为这些缘故而在半夜接到因网络崩溃而愤怒的客户所打来的电话。

最简单的避免这些事件的发生并确保客户高兴的方法就是在灾难恢复计划方面充分地培训用户,让他们利用好自动DR(灾难恢复)和分布式数据存储站点。

灾难恢复教育

尽管你知道拥有一个受过测试的DR计划的重要性,但是你的许多客户可能没意识到。你的角色是作为渠道合作伙伴来培训客户并演示为什么DR对公司运作是如此的重要。你可以很快地展示你作为商业合作伙伴的价值,展示为什么客户需要弹性的IT基础设施以及因为一个应用程序或服务故障会给整个基础设施和公司运作带来多少宕机时间。

这可以被类比成保险。DR计划是公司的保险单,预防因为灾难而导致的数据丢失和服务的损失。既然公司可以在其他商业运作上采用保险计划,为什么不能用在IT数据和服务上呢?

许多公司声称它们无法承受超过四小时以上的宕机时间。下图来自Chris Poelker和Alex Nikitin的《傻瓜型存储局域网》,它根据公开数据显示了不同行业不同的收入损失水平。根据你的客户所处的行业,你可以显示因为数据丢失或损坏、设备故障或站点故障而带来的宕机时间所带来的影响。

除了演示DR的价值之外,你还应该更进一步并解释为什么传统的DR和数据保护方式不再有效。许多公司可能不愿意实施新的技术,比如数据远程复制、快照或自动DR系统,但是昨天的技术已经无法处理今天复杂的虚拟和物理IT基础设施问题以及日益增长的数据仓库。

作为受信任的渠道合作伙伴,你可以展示一个自动DR系统可以在几分钟内将服务器恢复在线状态,而以前的IT人工方式需要数小时和采取无数的步骤和系统重启来恢复设备。自动DR会自己进行所有耗时的数据服务恢复步骤并自动化它们,可以在一个鼠标操作下激活。自动DR允许你将扩展你的DR产品扩展到新的和现有的客户。最好的显示DR计划和系统的价值的方法就是对DR计划的年(如果不是季度的话)测试。渠道合作伙伴可以和客户一起,在周末花几个小时,运行一个模拟系统崩溃,然后测试DR系统恢复系统和恢复运行的能力。客户将亲眼看到为什么DR对商业连续性如此重要。

从最近的风暴中,许多公司学到的最新一课就是数据和其他保存在离站DR地点的信息必须在地理位置上隔开来。例如,许多纽约公司就因为它们制定了DR计划并且将所有东西的副本都存在了新泽西州一家服务提供商上就认为自己是安全的。但是,桑迪飓风证明不同数据中心之间要有很长距离才能保证DR计划的成功。

我们已经知道冗余度和一个扩展的网络是理想的,但是这个认知必须传达给客户。数据和应用程序的副本不仅应该有针对IT问题下快速回复的本地存储,而且最新数据和服务的副本还应该复制到一个离原始数据中心许多英里外的离站地点,这样如果一个站点发生故障的话,备份站点还可以继续工作。

渠道合作伙伴,比如你自己,可以在课程中将最近自然灾害的教训与宕机行业信息结合起来,向客户解释为什么他们迫切地需要DR。如果你建议使用自动DR和地理上分离数据仓库的时候,你可以被你的数据中心客户视作英雄,因为你确保了他们的公司无论是面对自然灾害还是人为疏失都得到了完全的保护。

Ralph Wynn是FalconStor Software的高级产品营销经理。他在产品管理、营销、产品支持和部署领域拥有14年的经验。在加入FalconStor前,Ralph在Bocada、Syncsort和赛门铁克工作过。