本文首发于《信息存储》2006年度专辑上,未经许可,谢绝转载。
基于磁盘备份的兴起
在两级存储模型里,备份恢复通常使用的是自动带库和磁带;但是在多级存储模型里,备份恢复的实现方式就变得丰富多了,并且解决了许多基于磁带的备份恢复方案中问题。
基于ATA盘的近线存储和自动带库相比较有以下的不同:
1、 读写访问方式的不同—-基于磁带的备份恢复采用的是磁带作为介质,其数据的读写方式是采用顺序读写的方式。而采用ATA磁盘的备份恢复是采用磁盘作为介质,读写方式是随机读写方式。
2、 数据访问的有效性—-ATA近线存储采用随机读写方式,而自动带库采用的是顺序读写的方式,自动带库每次读写都需要执行基本的几个步骤:倒带倒头,进带定位,读取数据。因此,自动带库需要花费更长的时间才能读取数据。同时,自动带库没有办法修改数据,对数据的任何修改都带来后续数据的连续改动甚至不可访问。
3、 数据访问的并发性—-自动带库的数据访问受限于带机的个数,而且同批数据的访问也无法并发于多台带机,但ATA近线存储可以把数据条带分布在多个磁盘上并行访问,从而提高访问的速度。即使有软件能够实现将数据条带在多台带机上进行,由于磁带机的故障率远高于磁盘,事实上这种带机条带化在实际上是不可行的。
4、 数据访问的随时性—-如果磁带离开了自动带库,数据就无法被随时访问,必须由人工加载后才能访问。
5、 管理的复杂性¬¬—-磁带的保管需要科学的方法及人工的干预。对磁带的分类需要一个好的方法,比如采用条码加字母数字的编号等;磁带需要定期的被访问一下,以防数据因介质的老化而丢失等。
6、 数据的可靠性—-采用磁盘的方式,数据可以采用多种检错、纠错的措施来保证数据存储的可靠性,比如像NetApp的磁盘采用了先进的BCS介质级校验措施,同时还配备了独特的RAID DP磁盘级保护措施来防范同一RAID组任意两块盘任意时间发生故障。而采用自动带库,却缺少丰富的检错和纠错手段。目前,有的技术可以实现多台磁带机之间实现RAID,但在实际上应用上是不可行的。
基于以上的分析,我们可以看到基于磁带的备份恢复存在以下的问题。
1、 备份效率低—-通常磁带备份的备份粒度是设备级或文件级的,并且磁带只能采用顺序读写的方式,因此,虽然自动带库可以采用多台带机同时进行备份,表面上看链路通道很宽,但是实际上的单台服务器的备份速度还受限于服务器的输出能力,因此总体来看其性能并不高,效率也非常低下,而且会浪费许多的空间。并且一台服务器的数据分散在多台带机上进行部分,也带来了管理上的复杂度。
2、 恢复速度慢、不可靠—-由于无法在备份的时候把数据并行地备份到多台磁带机里,即不能把数据并行备份到多盘磁带里,因此多台带机并不一定能够提高恢复的速度,单个文件或文件系统的恢复往往还是只能通过同一台磁带机来恢复,因此速度仍然很忙。同时,由于磁带的不稳定性,并且没有类似RAID一样的有效手段进行保护,许多时候恢复往往无法保证能够正确的完成,这正是人们为什么保留多个拷贝的原因。
所以,近年来在ATA磁盘的价格大幅下降后,人们首先想到了利用ATA产品来完善备份恢复的解决方案。并在短短的几年里,ATA磁盘技术由最初的PATA发展到了SATA,并且SATA技术还在继续发展。而利用ATA磁盘的二级近线存储的应用范围也由单一的备份恢复解决方案增加了经济容灾、分类归档和法规遵从等多种解决方案。并且光是基于磁盘的备份恢复解决方案就发展了五种:虚拟磁带库、传统型磁盘备份恢复、先进性磁盘备份恢复、移动式磁盘备份恢复、桌面磁盘备份恢复等。
这五种基于磁盘的备份恢复解决方案将于以下作进一步的介绍分析。
虚拟磁带库(VTL)
虚拟磁带库(Virtual Tape Library)是把ATA的存储虚拟化成一台自动带库。其拓扑结构参见下图。
从上面的拓扑结构可以看出,ATA的存储(如NetApp的近线存储NearStore)前面连接一台VTL服务器,通过VTL服务器,ATA存储被虚拟化化成一台虚拟磁带库,存储空间会虚拟化成许多盘磁带。备份服务器会完全和原来访问传统的机械自动带库一样访问虚拟磁带库,进行备份和恢复。数据会先备份到虚拟磁带库内的虚拟磁带上,然后再转移到磁带上;恢复将可以改为从虚拟磁带库进行。备份的影像是一盘虚拟磁带。
通常VTL服务器是由一些软件厂商提供的软件运行在服务器上形成的,这样ATA的存储还可以进行其他的应用。但有些厂家会OEM这些软件并和ATA存储组合到一起,形成单一功能的虚拟磁带库。
采用虚拟磁带库进行备份恢复,具有以下特点:
1、 完全透明地集成进原有的系统。原有的备份恢复方式不需作改动,仅仅是备份恢复的目的设备改为虚拟磁带库。
2、 虚拟磁带库没有机械手的运动,不存在物理的卷带、进带、索引等动作,因此大大节省许多时间。
3、 在大规模并行备份环境下,传统的机械自动带库可以通过多台磁带机来提高吞吐性能,这可能会比虚拟磁带库的吞吐性能要高。其他的备份情况,虚拟磁带库会优于传统的机械自动带库。具体的吞吐性能需要根据具体的环境才能做出比较。
4、 但是在大多数恢复时,虚拟磁带库将会比传统的机械自动带库性能要好。
5、 尤其是少量数据恢复时,磁盘随机读写的特点会使恢复速度大大提高。
6、 由于备份的策略不作任何改动,因此,可能需要比较多的ATA存储容量。
7、 需要购买VTL服务器。
2.1 传统型磁盘备份恢复
传统型磁盘备份恢复也是基本不改任何现有环境的一种基于磁盘的备份恢复的解决方案。业内也对这种方式称为“Disk Staging”。拓扑结构参见下图。
在传统型磁盘备份恢复的模型里,近线存储前无需增加VTL服务器,近线存储本身就可以充当备份的目的设备。这主要是要求备份软件可以支持把数据目的设备配置成一个文件或目录,以普通文件的方式来记录备份的影像;而不是一个流式文件,必须把数据目的设备配置成流式磁带机。现在绝大部分的备份软件都支持这样的配置。
采用传统型磁盘备份恢复的模型,具有以下特点:
1、 基本透明地集成进现有的环境,而无需作太大地改动。备份的影像不是一盘磁带,而是一个预先定义长度的文件。
2、 需要确认备份软件支持目的设备配置成普通文件或目录的方式。
3、 属于文件增量型的备份方式。
4、 由于采用RAID对ATA磁盘设备进行保护,因此,如果不是规定限制,可以适当减少备份的影像数量,从而和传统机械自动带库相比需要较少的空间。
2.2 先进型磁盘备份恢复
采用虚拟磁带库和传统型磁盘备份恢复最大的优点就是对现有的备份恢复策略及实施影响不大。但是其缺点也是比较明显的:
1、 空间消耗大:虚拟磁带库需要把空间虚拟成磁带,因此,基于原有的备份策略需要多少磁带,那么磁盘也需要多少空间。并且,和磁带相似产生的空间剩余也没有办法利用。传统型磁盘备份恢复和虚拟磁带库相类似,但是由于没有把空间虚拟化成磁带,因此不会产生空间剩余的问题。但空间消耗仍然非常大。产生空间消耗大的根本原因主要是由于两者执行的都是文件级增量的备份模式。文件级增量的备份模式无论数据改动大小,哪怕仅仅是一个字节,也需要将整个文件全部备份下来。这样对于增量备份和差量备份都会带来比较大的空间消耗。即使是全量备份,一样的两个版本的文件,同样需要两份空间,无法利用一份拷贝保存多个版本。因此虚拟磁带库和传统型磁盘备份恢复对空间的消耗是非常可观的。
2、 无法直接恢复:无论虚拟磁带库还是传统型磁盘备份恢复,其备份的数据都是备份软件特定的格式,无法直接访问,并且需要相应的索引库来进行辅助索引的。因此,在恢复的时候,首先需要通过索引库的检索,然后需要把相关的文件先恢复,最后才能被访问。
3、 实际上无法实现远程集中备份:虽然备份软件支持远程备份的功能,但是,由于远程站点和数据中心之间的链路带宽远远支撑不了文件级增量备份的模型,因此,实际上远程站点要想实现集中备份到数据中心,必须寻找新的备份模型。
NetApp通过分析世界上财富1000强的公司的IT需求,提出了新的备份模型:先进型磁盘备份恢复。
先进型磁盘备份恢复充分接合NetApp公司独特的“零拷贝”模式的快照技术,实现了数据块增量型的备份,用一份拷贝提供多个版本,一方面大大减少了空间的消耗,并且备份数据可以直接访问,极大地改善了数据的恢复灵活性和简单性;另一方面大大节省了链路的带宽需求,解决了远程站点集中备份的问题。
NetApp的先进型磁盘备份恢复解决方案中一级存储可以分为NetApp产品和非NetApp产品两种,二级存储采用NetApp的产品。在这里需要指出的是,NetApp产品包括采用FC磁盘的FAS存储和采用SATA磁盘的NearStore存储。两者的管理和应用是一致的。
一级存储采用NetApp产品的模型中,一级存储和二级存储之间采用SnapVault软件来进行数据块增量的复制,传递的仅仅只是一级存储中两个时间点之间的快照相差的数据块。由于一级存储采用的是NetApp“零拷贝”的快照模式,因此,对前端应用服务器的性能没有任何影响。
一级存储采用非NetApp产品的模型中,一级存储和二级存储之间采用OSSV软件来进行数据块增量的复制。OSSV软件需要安装在前端的Windows或Unix的服务器上。在进行备份时,OSSV需要将现在文件系统和上一次备份的文件系统进行比较,识别出相应的数据块增量,然后传输到二级存储。因此,对应用服务器存在一定的性能影响,但是由于不需要传输大量的数据,因此和虚拟磁带库及传统型磁盘备份恢复模型相比,性能的下降还是可以接受的。
以上两种模型除了第一次和二级存储进行初始化备份时需要复制全部的数据以外,以后的备份仅仅需要传输有效改动的数据块。并且在二级存储上形成可以直接访问的拷贝。用户可以借助这些拷贝进行数据恢复、经济容灾等。
NetApp的存储最多可以保存255个备份拷贝,用户可以自行配置小时级、天级、周级的拷贝个数。比如保留两天连续48个小时级的拷贝、一个月内31天的天级拷贝、一年52周的周级拷贝,总共也就131个拷贝。
采用先进型磁盘备份恢复的解决方案,具有以下特点:
1、 空间消耗大大减少:在二级存储上多个时间点的备份拷贝共享同一份基准数据,相差的仅仅是改动的数据块,因此这种数据块级增量的备份方式比文件级增量的备份方式消耗的空间要小的多。
2、 备份拷贝可以直接访问:和需要备份软件先恢复再访问的模式不同,先进型磁盘备份恢复的备份拷贝可以通过相应的时间点进入直接访问相应的拷贝。因此,对于用户误删除、病毒感染、黑客攻击等逻辑灾难,用户可以无需系统管理员的协助就能够进行恢复;当一级存储发生灾难时,还可以切换到二级存储,实现经济容灾;这些拷贝还可以作一些增值的分析应用。
3、 可以实现远程集中备份:由于传递的是有效改动的数据块增量,因此对链路的需求不大,利用先进型磁盘备份恢复可以把多个远程站点的数据集中备份到数据中心,在进行磁带备份,这样可以降低远程站点的维护人员的素质要求,优化企业的系统架构,降低整体拥有成本。远程集中备份需要注意的技术难点除了备份外,更重要的是恢复,对此NetApp有完整的解决方案。
4、 可以实现经济容灾:由于保存在NearStore上的备份拷贝是可以直接访问的,因此,当发生环境灾难时,客户端可以失效切换到二级近线存储,继续工作,同时在后台进行数据的恢复。这其实已经把备份的概念拓展到了容灾的领域,是新型“经济容灾”的一种实现模型。未来NetApp还会推出一种“按需优先恢复”来进一步完善数据恢复的解决方案。
2.3 移动式磁盘备份恢复
采用磁带备份有一个特点是磁带可以离线异地保存,以防范环境灾难。通常采用基于磁盘的备份方案都很难做到把磁盘象磁带一样离线异地保存。这里需要磁盘系统对重新上线的磁盘能够识别,并且把保留在里边的数据读取出来,否则离线后数据就无法还原了。
NetApp的存储系统对磁盘的物理位置是不关心的。这种磁盘物理位置的无关性使得磁盘可以被离线后取下,并异地保存,一旦发生灾难,可以把这些磁盘安装上另外的NetApp存储系统上,并上线后迅速地访问产品上备份的数据。这样磁盘备份也拥有了相应磁带的特征,成为了移动式的磁盘备份恢复。值得指出的一点是,离线的磁盘无需做详细的标记,重新上线后也无需讲究磁盘需要的具体顺序或槽位。这样大大简化了管理的复杂度。
2.4 桌面磁盘备份恢复
企业当中备份相关的课题,包括三个方面:数据中心服务器的备份、远程站点的集中备份、以及桌面系统的备份。
桌面系统包括台式机和笔记本等个人电脑设备,通常对这些系统的备份是很困难的,因为桌面系统随时可能离线,而且笔记本还有可能到处移动。
但是我们也必须面临对桌面系统备份的问题,否则,公司重要的商务数据可能因为核心骨干的离职而丢失,或者员工们的系统遭病毒攻击后所有的数据全部损失,还有可能我们需要实现法规遵从等。
解决的办法有多个:
1、 要求员工自己备份:这会增加员工的负担,并且分散的备份风险很大、也没法管理。
2、 采用集中存储、实现个人目录:这种模式在外企是非常成熟的方案。所有的员工在集中的文件服务器上拥有个人独立的空间,用户可以在任何一台终端登陆,访问自己的数据,享有熟悉的界面。所有数据都保存在数据中心的存储上,桌面系统的备份需求大大降低,只需要解决好数据中心服务器的备份就行了。但是部分员工保存在桌面系统的数据还是没法部分,比如部分常出差的员工的数据可能保存在自己的笔记本电脑里。
3、 采用桌面磁盘备份恢复方案:这通常需要在相应的桌面系统上安装上一个客户端软件,实现一级桌面系统的数据向二级近线存储进行备份。这种解决方案有很多。
订阅《信息存储》杂志请 点击此处链接