一个成功的灾备系统能够帮助企业防御风险,实现建设目标,但是一个失败的灾备系统就会成为企业的沉重包袱,有“灾”而无“备”。
容灾备份体系建设可以从很多个角度去考虑,但其中排在第一位的、最重要的一项是:哪些灾难类型本次建设须要考虑、这些灾难类型的RPO/RTO等指标是多少?
灾难的防御范围,常规上大家重点考虑一些硬灾难,包括服务器、存储等硬件设备损坏造成的宕机;地震、火灾、机房进水等造成的机房失效,也有空调损坏、多站供电断电等意外;甚至当瘟疫蔓延时机房无法进入等极端情况。
这类灾难一般被称为“‘硬’性灾难”或“站点级灾难”,意指整个站点失效,整个站点所提供的服务均被中止。
我们需要看到,还有很多灾难类型,灾难发生后,虽然建筑、设备、人员都是无损的,但整个机房站点同样失效,整个站点所提供的服务同样被中止。这类灾难我们称为“‘软’性灾难”或“类站点级灾难”。它们带来的后果同样是灾难性的、甚至更加严重。
“‘软’性灾难”或“类站点级灾难”主要指软灾难,如一些恶意行为:外部黑客攻击、内部高技术犯罪;和一些失误行为:系统维护失误、误删除重要数据、打入冲突系统补丁。。。等等。
“‘硬’性灾难”或“站点级灾难”的发生是管理人员能够即刻发现的,造成的损失大多可以立刻评估、处理。而“‘软’性灾难”或“类站点级灾难”大部分无法被管理人员立时发现,造成的损失一般要远远大于前者。而且,恢复起来很麻烦,需要企业投入更多的资源、承担更多大的风险去解决。
下图是国外的权威数据分析机构针对导致企业数据受损、业务中断的各类灾难的发生机率做出的报告,从报告中我们可以发现,其实经常让我们谈“灾”色变的地震等自然灾难发生的机率只不过3%,而真正造成企业业务连续性中断的是来自于“‘软’性灾难”或“类站点级灾难”,综合发生机率超过50%以上。
传统容灾技术从诞生至今,已发展十数年未曾改变。这些传统容灾技术在帮助用户分析灾难时通常会刻意强调“‘硬’性灾难”或“站点级灾难”的防御,而处处回避“‘软’性灾难”或“类站点级灾难”,并将这些更具破坏性的灾难类型推卸给备份技术而逃避容灾规划中最重要的环节。
然而,无论技术怎么发展,用户对灾难防御范围的要求却始终如一:防御所有类型的灾难是容灾系统建设的首要目标!因此,找到一种能够全面防灾、时时做到‘有灾即有备’的灾备技术,成为用户灾备建设成功与否的基点。
容灾备份体系建设的要素还有很多。全面考虑业务连续性体系的各个方面,抓住最重要的环节,进行深入细致的评估和分析,就能够使有限的资金发挥更大的能量,达到事半功倍的效果。