连载 制定应用数据保护策略二 传统的数据保护做法

DoSTOR存储在线 11月21日国际报道:有很多种传统的数据保护方式满足RPO和RTO的时间范围,这些做法被划分为以下几类:备份、磁盘镜像、快照复制、CDP 和VTL。备份每天在备份窗口执行一次。在过去的二十年里,在确保应用软件,尤其是和数据库相关的应用软件可在窗口中被中断或暂停从而获得可以再利用的数据副本方面,耗费了大量的投资。如果没有这些重要的主机软件和备份过程的投资,就不能保证所有交易的全部数据能够以能被应用程序所识别的方式被抓取,以至于用于恢复用途的数据副本的可用性大打折扣。

多年以来,人们开发了各种各样的方法来缩短应用软件的脱机时间。这些将继续是人们关注的方面,同时,来自现场的对不同用户应用和各种客户环境的测试对每种新方法来说也是非常重要的。建立管理过程、最小化实施复杂程度、确保含盖所有应用以及如何获得对新方法的信赖,都是客户拒绝或拖延采用新的数据保护技术的原因。

一。故障及数据丢失的原因

二。传统数据保护方法

1。备份 

全备份/恢复

全备份/恢复用于所有的数据类型,是最常见的数据保护方法。该方法对数据进行100%复制,通常是一个完整的文件或卷,从主磁盘复制到磁带或备份磁盘。备份副本是不可执行的,并且必须通过恢复才可以被应用程序进行访问。多数情况下,传统的备份和从其副本恢复过程会对应用程序又影响甚至需要中断应用程序。

备份或恢复的对象越大,应用程序及其用户等待的时间就越长。对于关键业务或产生收益的应用程序,等待完成备份或恢复操作的任何时间都意味着花销。

文件或卷的全备份和恢复是数据保护技术中是最耗时的,而且可能不易安排。数年的研究显示很多备份数据与先前备份的数据是相同的。备份大量未改变的数据产生了大量不必要的重复冗余数据,然而作为数据保护策略,全备份和恢复提供了较高的可信度,因此仍在继续被人们使用。

由于备份和恢复过程的时间消耗特性,传统的备份/恢复正在转变为一些衍生的技术。在选择这些选项来制定有效的备份策略时需进行折衷,并且需进行认真的审查。

增量备份

增量备份对最近一次完全备份或增量备份之后发生变化的数据进行备份。由于只对变化的数据、文件或块(根据具体的实现)进行备份,该方法使备份数据的数量最小化,并且缩短了"备份窗口"需要的时间。然而,由于每个增量备份通常必须按顺序恢复到它们最近的状态,其完全恢复需要耗费更多的时间。这将可能是一个复杂的且耗费时间的过程。通常每周进行一次完全备份,每天进行一次增量备份。增量备份最小化了备份时间,但恢复变得更加复杂。

差异备份

差异备份前一次差异备份的数据以及本次与前一次差异备份间新变化的数据进行备份。这就是完全备份之间的差异备份的容量每天典型地在逐渐增加的原因。这意味着每天的备份在逐渐增大,因此耗费更多时间,但是恢复过程比较容易并且通常比完全备份或增量备份的时间更短。完全的恢复只需要最近一次的完全备份和最近一次的差异备份即可完成。差异备份耗费的时间比增量备份长,但它恢复得更快。

小结:增量备份最小化了备份时间,而差异备份最小化了恢复时间,特定的应用可以支持其中的一种或另一种。这些利弊权衡往往让存储管理员感到困惑且耗费时间。大多数的企业都想减少让人痛苦的备份数量,同时缩短恢复的时间,而非只实现其中的一项。增量备份和差异备份都是针对特定应用及备份软件的。多个应用需要多个实现,从而增加了复杂性。

2。镜像 

磁盘镜像

磁盘镜像用于所有的数据类型,使用本地或远端磁盘驱动器实现块到块的文件、逻辑单元或物理磁盘卷的复制。一旦通过对原始数据元素进行复制而建立了镜像数据元素后,所有其后的写操作将被存储到两个(或多个)位置,创建相同或几乎相同的副本。当其中的一个副本出现问题时,磁盘镜像将提供几乎是即时的到第二个副本的访问,从而使应用可以继续而不会停止。镜像是高开销的,它使得需要的磁盘存储量加倍,显著增加了初始获取及正在进行的运行开销。同时,存储管理员必须选择实行异步或同步镜像,需对每种情况进行利弊权衡。同步镜像经常应用在主机及其它应用具有关键性特征的高可用环境中。同步镜像中,源设备及目标设备必须在确认写操作已经完成后,才能进行下一次写操作。这会降低应用的性能,但使得镜像元素与真实的(准确的)数据元素相互同步。

异步镜像

对于异步镜像,源设备和目标设备不必同步它们的写操作,从而允许第二个以及后面的写操作独立进行。因此异步镜像比同步镜像更快,但是其第二副本会和原本有轻微的失步。异步镜像有时应用于广域的备份市场以将数据复制到数百里以外的地方。由于数据量庞大,而高速带宽又价格不菲,这将造成非常高的开销。实际中,备份的数据相对原数据的滞后或失步很少会超过一分钟。但对于特定的关键任务的或写操作频繁的应用来说,备份数据的滞后或失步将会带来极大的风险。

小结:镜像应用于许多关键任务的应用中,由于其通过自动转换到镜像副本的恢复操作在几秒或者更短的时间内即可完成,因此它是硬件子系统或设备故障时进行数据访问的最快方法。 注意镜像并不能帮助保护对数据的损坏,如黑客、蠕虫、病毒、入侵、人为或软件错误,而只是生成了两个或多个侵蚀了的副本。为了最好的效果,镜像通常应和其它能够恢复到数据受损之前的干净数据的保护方案一起使用。磁盘镜像被定义或通常被称为RAID 1。

三。数据保护新方法

由于传统的数据保护方法存在折衷及局限问题,其它的一些技术正在日益发展以减少传统方法中的一些局限。

1。快照

快照副本给出变化数据的一个一致的时间点视图。众多的数据存储提供商提供各种各样的快照实现,但并非所有快照的建立都是相同的。当使用快照副本的同时有写操作发生时,发生变化的区域(写)被保存到磁盘的一个单独的专门为快照活动所保留的存储区域或分区中。这里影响到的区域或块的旧值可以被保存以防新的块被破坏,或者允许建立虚拟数据映像,用于不停机备份。存储管理员需管理快照的数量及类型。

小结:照提供了对入侵和数据破坏的保护,但没有对源数据设备的故障进行保护。这里也存在折衷。快照副本面临的挑战是不易找到正好在数据破坏发生前的那个快照副本,同时当快照的数量增加时复杂性也在增加。基于多个应用及软件的实现会使应用快照的复杂性增加

2。CDP

CDP(Continuous Data Protection持续数据保护) 是使得每个写或更新操作被持续地写入磁盘设备,该磁盘设备可能和主设备相同或不同,在需要的时候能够恢复数据。如果说快照副本是一系列静态的图像,那么CDP就如同是一部电影。然而与镜像不同,CDP的第二副本是带有时间戳的写事件的连续历史。所有的写操作在从盘或日志设备中进行排队。典型地日志记录2~4天的连续历史,覆盖数据恢复最大可能发生的周期。日记对保护入侵及数据侵蚀尤其有益,它可以完成到发生数据损坏之前时间点的恢复。稀疏日志用于记录更加重要的任务的写操作。这里存在着利弊权衡。

小结:CDP和快照副本面临同样的挑战,它们不能替代传统的备份或者在数据中心发生丢失时提供保护。CDP非常适合对数据变化量小的环境中的数据损坏进行恢复。基于多个应用及软件的实现会使应用CDP的复杂性增加,许多应用不支持CDP。

3。VTL

VTL(虚拟磁带库Virtual Tape Library)解决方案的数量在不断增加,目前备份/恢复市场中有超过25家公司在提供各种各样的虚拟磁带的应用。主机虚拟磁带的概念最先出现在1997年,并通过IBM和StorageTek开始普及,因为磁带盒的有效利用进入了历史上的低谷。虚拟磁带的应用带来的益处有目共睹,VTL现在可在非主机系统中用作快速磁盘缓存。

虚拟磁带库由一个磁盘组构成,看上去像属于磁带库的若干磁带机,但并不包含实际的物理磁带库。VTL通常有两种类型:集成的和独立的。集成的虚拟磁带库将磁盘阵列作为前端与自动磁带库相结合,而独立的虚拟磁带库不直接控制物理磁带库。磁盘存储在大容量且低开销的磁带库中用作高速缓存或缓冲器存储处理比较活跃的数据。在操作系统看来如同多个磁带机而非物理磁盘驱动器,从而把磁盘"虚拟"为自身以外的其它设备。

虚拟磁带系统在一个物理磁带盒中储存多个虚拟磁带卷,通常可使磁带盒的利用率达到80%或更高。随着磁带盒容量的快速增加,提高其利用率将变得更加重要。预定的策略,如文件大小、使用容量及使用频率决定了何时将数据直接移入或移出磁盘缓冲及磁带库。这种情况下,类似HSM(分级存储管理Hierarchical Storage Management)基于策略的功能存在于应用服务器之外,直接控制磁盘和磁带存储器间双向的数据移动,从而使得第2级和第3级的存储间能直接进行数据传输。

小结:虚拟磁带的益处,如高性能(可以频繁的从磁盘高速缓存中进行数据访问),显著地增加了磁带盒的利用率,通过定义多个磁带动器而非增加物理的并行I/O活动,简化了备份策略的管理,并且通过减少磁带驱动器及介质的数量获得经济效益。这里同样存在着利弊权衡,因为有很多种技术可供选择,确定适合本企业选择最佳VTL需要花费很多时间。