谁说容灾难普及之Ⅰ:容灾的前世今生

说起容灾,无论是IT管理员,还是行业专家,各有各的说法,纷繁复杂的技术和理念,争奇斗妍的方案和产品,让人犹如雾里看花般,难辨优劣。但是,对于需要容灾的用户而言,首先要搞清楚的,就是到底容灾是什么?容灾解决什么问题,具有什么价值,如何去选择解决方案?而这,也是我们这个系列文章的出发点,看清容灾,看清方案、成本和价值,让选择更加从容,方案更加专业。

一、欲用其妙  必先知其道

亚里士多德有言,“If you would understand anything, observe its beginning and its development.”意即:如果你想明白一件事情的话,就要观察他的开始和以及他的发展过程。正如国语有言,“欲用其妙,必先知其道”。

所以,对于纠结于各种容灾定义的大家来说,首先需要做的应该是追本溯源地了解一下到底什么是容灾,有怎样的一个发展过程,在这个发展过程中又有哪些经久不变的追求,接下来就让我们一起来梳理一下容灾的前世今生。

二、什么是容灾

面对应接不暇的容灾介绍和定义,其实用户真正关心的只有两点:首先,是否可以保证数据不丢失;其次,是否可以保证应用不间断。在我们的IT应用中,也接触到一些可能是解决这些问题的应用,比如双机高可用方案就是解决应用不间断的问题。但真正意义上的容灾,必须具备同时保证数据不丢失和应用不间断的能力,这也是容灾的最基本的目标。

在这里很容易出现另一个困惑,一提到容灾,就会提到备份、快照、镜像、CDP和双机等等名词,它们跟容灾有怎样的关系呢?或者它们是不是就是容灾呢?

备份的主要实现方式是将数据从原位置移到目标端,形成可任意恢复的时间点。一切不以恢复为目的的备份都是耍流氓,所以,备份仅仅是用来保证数据不丢失的一种技术手段,让用户在关键时刻能够拥有可以恢复的数据,并不是一种应用。另外,像快照也是在原介质上根据某一时间创建一个照片,镜像则是建立实时的对等的版本,以保证意外情况下的数据可恢复性。对于应用来说,大家可能认为双机是可以保证应用不间断的,但是双机有一个非常明显的缺陷,就是不能保证数据不丢失,因此它仅仅是一个高可用的方案,并不能作为普及容灾的一种通用型方案。

所以,无论是备份也好,快照也好,CDP也好,双机等等,他们都是容灾的一部分,属于容灾的范畴,是实现容灾的技术手段,因为它们只能解决一部分问题,真正的能做到普及容灾的方案应该是一套完整的方案。

那么,到底什么是容灾呢?

容灾严格来说主要包含三个部分,分别为数据容灾、应用容灾和业务容灾。但是对于我们用户来说,绝大部分只需要关注两个部分,第一部分是数据容灾,第二部分是应用容灾,并且分别包括本地和异地的部署方式。其中数据容灾解决的是数据不丢失的问题,而应用容灾解决的是数据不丢失以及应用不间断的问题。

三、容灾的前世今生

只要有计算机技术,只要有数据,只要考虑数据安全问题,容灾就是不可避免的话题,在五六十年代就已经凸现原型的容灾,在这几十年来,又是如何诞生并发展起来的呢?

纵观容灾的整个发展过程,就会发现,从最初发展到最近的90年代,当备份方案使用不起身价高昂的磁盘备份介质时,均是以磁带备份为主,那要做异地容灾该如何办?惟有采取异地磁带托管的方式。所以,也随之出现了磁带托管业务的繁荣局面。在中高端的存储磁盘阵列出来后,逐步出现了通过磁盘镜像技术实现实时复制效果的方案,但因为成本过高,应用范围非常有限。因而在90年代,备份技术一成不变,一直波澜不惊的以磁带备份为主。

到了00年代,备份还是以磁带为主,但在这时发现磁带在性能和管理方面的瓶颈越来越明显,所以为了突出更强劲的性能、更好的管理等,磁带库技术应运而生,并且逐渐成为主流,但是因为磁带介质本身无法避免的一些硬伤,比如它在备份过程中管理的复杂性,而最主要的是磁带介质数据长期保存的可靠性不高,90年代的一个调查数据表明,47%的磁带备份数据的无法恢复,这就是磁带介质最大的硬伤。

一切不以恢复为目的的备份都是耍流氓,如果备份的数据无法恢复,那备份的意义就不复存在。所以基于磁带备份这样一种遗憾,00年代诞生了一种非常重要的技术 — SATA磁盘技术。SATA 磁盘技术的诞生不仅仅意味着性能的提高,更意味着容量的提高,意即单位GB的成本越来越低了。有了这样一种新的应用,就有人开始思考,如何用磁盘替代磁带,但是因为主流的备份软件都是以磁带为核心的,并不支持磁盘,所以这是一个各路英雄都感到棘手的问题。

乱世出英雄,IBM在03年时基于这样的应用需求,发明了一种新的技术 — VTL虚拟磁带库,旨在把磁盘当做磁带用的同时,还可用好用户环境现有的备份软件。VTL 的横空出世虽然没有对备份方案做出实质性的改变,但却做了一个非常好的铺垫,就是开始把磁盘应用于备份方案,这是容灾非常重要的一个转折点。

磁盘一旦用于备份,即刻显着拉动磁盘的需求,磁盘成本逐渐下降,而随着广泛的应用,磁盘技术的革新得到进一步优化。随着磁盘的异军突起,就会发现在备份领域,磁盘介质有一个很重要的特性在虚拟带库里面是没有应用起来的 — 磁盘的随机访问特性,因为磁带不是随机访问的,所以虚拟带库将磁盘虚拟成带库后,就牺牲了磁盘这个最大的特性,所以,VTL的技术特性绝大部分仍然跟磁带一致,唯一改变的就是用了一个更可靠的介质。

需求催生应用,这个时候,业界就开始思考如何更好的使用磁盘。

在应用磁盘备份的过程中,第一个阶段就有一个非常重大的技术突破出来,那就是CDP技术。前面提到,容灾首先要解决的问题是数据不丢失,而无论是磁带备份,还是虚拟磁带库,都有一个很大的硬伤,即数据丢失量大。因为它们不能实现随机写,所以它在做数据布局的时候,不能实时的不停的写和更改,这也就意味着它一定存在一个备份窗口,也就是说数据不可能不丢失。所以当应用磁盘备份后,首先要解决的问题便是备份窗口带来的数据丢失,解决这个问题的技术就是CDP持续数据保护技术。然后又相应地出现了解决应用不间断的高可用技术。

但是,我们会发现,CDP和高可用技术是分开的,即备份是备份,双机是双机。因而,业界会普遍面临一个问题 — 一套系统里,要么解决了数据不丢失的问题,要么解决了应用不间断的问题,没有合二为一的方案。但用户的需求实实在在的摆在那里,容灾一定要上,因为不只是数据不丢失的需求,还要保证应用不间断。

所以,到了现在,慢慢出现了一种新的主流技术 — 一体化容灾,将如CDP、Realtime、Deduplication等技术合在一起,如赛门铁克的NBU,EMC的BSR部门,爱数的爱数备份容灾家族产品系列,目的都是一个,就是突出一体户容灾,这也是目前以致未来容灾方案发展的趋势。

四、性能与管理? 30年来一直不变的追求

从上面的分析我们可以看出,容灾的整个发展过程,基本上是非常鉴定地围绕两个目标在追求 — 第一个就是更好的性能,第二个就是更好的管理。而且这两个目标也是用户在选择容灾的时候,需要考虑的两个指标。

在性能方面,从磁带到磁带库,到CDP,再到应用容灾,都是为了实现更小的RPO和RTO。

在管理方面,最开始的80、90年代,用户只需针对单个系统做备份即可,所以备份软件的鼻祖都是从UNIX发家的。但随着服务器和应用的增多,就会逐渐变成以Master Server和Media Server为架构的备份系统,于是,大家需要通过购买服务器(Sever)、操作系统(OS)备份软件(Backup Software),甚至加上存储硬件(Storage)来完成一套完整方案的部署,这也就是4S方案,一定要这样做吗?其实,现在已经有很多很好的技术可以突破这个传统的4S方案了。在08年的时候,市场上以爱数为首出现了一套新技术 — 一体化备份系统,意即将传统4S方案的步骤一步到位,集成化的实现,将管理的复杂度降至最低。而现在,几乎所有的备份厂家都已经开始推一体化的备份系统,包括赛门铁克、EMC等等。

前面提到,备份只是容灾的一部分,因为它只是一种技术实现手段,并不能覆盖所有的技术方案。但容灾要解决的是两个问题, 一个是数据不丢失,一个是应用不间断。一体化备份解决了数据不丢失的问题后,另一个问题的出路又在哪里?很明显,就是既能保证数据不丢失又能保证应用不间断的真正的容灾 — 一体化容灾。

一体化容灾的出现就是极限吗?在管理上解决了所有问题吗?

这里我们就会发现,它还有一个漏洞,一套容灾系统它只是解决容灾需要解决的性能问题,但并没有将容灾整体的管理起来,这也就脱离了它真正的核心 — 为了实现企业经营目标而用容灾。所以,随着一体化容灾的出现,接下来会有一个更主流的容灾管理模型出来,那就是基于法规遵从的一体化容灾,能够将企业管理的价值目标和容灾管理的技术目标有效结合起来,有效推动容灾最广泛的普及。

五、容灾,可以仰望,不可企及?

万变不离其宗,通过以上的分析,容灾前世今生的脉络已经非常清晰,我们可以看到,容灾的发展是由各种技术和需求集成发展而来,最终,均归纳成一个同时具有数据不丢失和应用不间断能力的一体化容灾。对于我们而言,容灾的需求清晰而明确,核心需求就是数据不丢失和应用不间断,但是在大量市场调查显示,用得起容灾的用户少,用得好容灾的用户少之更少,容灾在用户的印象中简直望而不可及,难以普及,它到底有哪些痛处,该如何对症下药,请继续关注谁说容灾难普及系列之Ⅱ:为什么容灾难普及。