虚拟磁带库 变革数据保护流程

    当数据从用户业务系统中产生以后,就开始面临着严峻的数据保护问题。长期以来,用户已经习惯了采用磁带库进行主要的数据保护工作,但是随着磁带库管理工作中存在的问题日益严重,人们正在尝试新的途径来改善数据保护工作,其中虚拟磁带库(Virtual Tape Library,VTL)是一个十分成功的解决方案。

    虚拟磁带库的概念非常简单,它本质上是磁盘阵列硬件设备,但是在软件功能上模拟磁带备份的形式,因此对于存储管理员来讲,它就是一个磁带库,对它的管理如同管理一个物理磁带库一模一样。

    可以说,虚拟磁带库已经成为当今存储界最为热门的话题之一,VTL的崛起,正在深刻地改变着传统的备份市场格局和用户的数据保护模式。进入2005年,传统机械磁带库厂家纷纷推出虚拟磁带库作为高端产品系列,VTL成为市场主流的趋势已非常明显。

    机械磁带库的缺陷

    磁带库是一个机械密集型设备,有用户曾用开玩笑的口吻说:“磁带库厂商不应该属于IT厂商,而应该是机械厂商。”因此,磁带库具有一些作为机械产品而不可逾越的问题。

    维护负担高:磁带库的核心部件磁带驱动器为非封闭机械易损件,本身故障率高,灰尘、潮湿等使故障率不可预期,导致设备可用性差。

    备份失效率高:采用磁带库进行数据保护的介质磁带为非封闭介质,且磁带库中的磁带之间没有容错保护。备份业务涉及到的磁带组中任一盘磨损、卡带、霉点、粘连等,均会导致整个备份无法恢复。

    备份恢复能力不佳:虽然磁带本身的读写速度已有长足提高,但备份恢复时需要抓带、加载、机械定位文件等机械动作,等待时间长,而备份恢复时一般会涉及多带查找,应用端被迫因此延长待机时间。

    在用户的数据保护工作中,解决机械磁带库问题的主要方案有磁盘到磁盘(Disk-to-Disk,简称D2D)和VTL。与磁带不同,基于ATA的磁盘阵列比传统的光纤通道磁盘阵列的成本低很多,同时逐渐变得非常流行,它可以方便集成到备份系统中。

    D2D将盘阵连接到备份服务器,将文件系统放置其上,使用备份软件的本地功能备份到基于磁盘的目标上。这一过程听上去很简单,但是需要用户改变备份系统的配置;最后的碎片还会引起性能的问题,基于文件系统的目标不能以磁带库的方式进行共享,需要管理员为多个备份服务器进行磁盘阵列的分区。

    VTL使得磁盘阵列对于备份/恢复系统来说像是磁带库,这样一来,无须改变配置就可以在备份系统中使用磁盘,而备份系统仍旧认为在向磁带进行备份?只有你知道其中的奥秘。如同物理磁带库一样,VTL可以通过驱动器共享软件来进行共享。此外,大多数VTL在磁盘上存放数据的方法确保了零碎片。

    VTL的优势

    几乎在机械磁带库发明的同时,VTL概念就已经出现并得到应用。但是,受限于技术局限,长期以来VTL只是作为机械磁带库的缓存,应用也因此而局限于封闭的大型机系统等高端用户群,市场认知度很低。

    相对于机械磁带,虚拟磁带库使用了兼容磁带备份管理软件以及传统备份流程,这使得设备的可用性及备份的可靠性都得到了大幅提升。

    设备可用性提升:虚拟磁带库用电子化的“机械手”和“磁带驱动器”,代替了机械磁带库中裸露、易损的系列机械装置,基于RAID保护的磁盘阵列具备降级工作能力,且具自动报警和在线热恢复能力。

    备份可靠性提升:虚拟磁带库采用基于RAID保护的磁盘阵列,从而将备份的可靠性较常规磁带备份提高了若干量级。封闭式结构的磁盘介质本身的MTBF(平均无故障间隔)一般为开放式结构的磁带介质的5倍以上。

    恢复工作极为简便:如果所需数据存在VTL当中,则不会涉及任何机械工作,恢复工作就像磁盘备份的速度一样。

    VTL突破D2D

    D2D方案包括文件复制、数据镜像、快照等形式。文件复制或镜像不仅使备份数据持续暴露在病毒、人为误删等在线威胁之下,同时也只保留在线数据的最终状态,数据灾难发生后无法恢复历史数据。在较为成熟的快照技术中,镜像式快照消耗容量过大,指针式快照虽然支持类似常规备份的增量快照,但必须捆绑专用软件系统,总体拥有成本过高。

    D2D解决方案存在最大的问题,是与文件系统相关的缺陷。结合外接RAID阵列的备份/恢复软件的D2D性能依赖类似NTFS和NFS的文件系统,它们是为了在PC服务器系统中使用而生成的。这些文件系统用来为多个用户管理多个小型文件,在磁带备份应用软件执行较大的写操作时,会发生性能冲突。

    大多数D2D RAID阵列使用的通用文件系统对于磁带备份并非是最优化的。与备份系统相关的通用文件系统还存在的另外三个问题:大多数通用文件系统同典型的服务器一样,随着时间变化产生大量文件系统碎片;类似FAT、NFS和NTFS的通用文件系统受到文件系统、分区和单个文件大小的限制;大多数D2D文件系统存在安全性隐患。

    VTL在备份过程中超越D2D系统的原因之一是,备份应用软件将备份写到VTL磁盘,这类似以数据流形式写到磁带。另一方面,D2D写单独的文件,在对下一个文件操作前,必须记录每个文件的位置和文件系统的元数据。VTL以数据流形式写而不是以单独的文件形式写,这一方法能够避免受到文件系统所支持的最大文件数目的限制。VTL文件系统的专有特性克服了D2D的通用文件系统遇到的限制问题。

    在安全性方面,访问VTL的文件系统和访问磁带类似,用户不能直接访问磁带,被病毒感染的文件也不会感染磁带。

    VTL可以提供综合/集中全量备份的好处,在知道了所有文件的位置和发送的时间后,就可以简单地使用指针来建立新的全量备份。使用指针可以建立一个新的虚拟全量备份,来取代从一个虚拟磁带向另一个虚拟磁带拷贝数据。当新的全量备份建立后,可以告诉备份软件全量备份的内容和全量备份所在的“磁带”,然后备份软件会把该全量备份看做和其他全量备份一样。该全量备份还可以用于进一步的增量备份和恢复,并且能拷贝到真正的磁带。

    虚拟全量备份除了即时功能以外,在容量方面也具备优势。如果使用备份软件建立了真正的综合全量备份,与通常的全量备份一样,也会占用同样大小的磁盘空间。然而VTL的虚拟全量备份几乎不会占用任何磁盘空间,因为VTL仅仅使用了指针。

    应用篇

  


    传统数据保护 问题重重何时休?


    如图1所示,这是一个典型的用户数据保护环境(为了便于说明问题,我们省略了用户冗余系统与容灾系统)。

    当数据从关键应用系统中产生以后,不能够直接进行备份。原因在于备份工作一方面会影响业务系统的高效运行,另一方面备份工作经常会出现各类问题而无法成功完成,这时就会造成数据的丢失。因此,用户需要一套性能可以与在线系统相比拟的磁盘系统进行数据复制,然后对复制的数据(与业务系统一致)进行备份。

    镜像磁盘系统仍为高端产品,在有些业务系统中镜像系统与业务系统完全一样,因此价格昂贵。传统磁带库在运行中自然存在着各种各样的机械问题。

    应用第一步:无缝融入原有系统

    如图2所示,使用虚拟磁带库使得磁盘阵列对于备份/恢复系统来说像是磁带库,这样一来,无须改变配置就可以在备份系统中使用磁盘,而备份系统仍旧认为在向磁带进行备份。对于业务系统而言,几乎感觉不到任何改变,在逻辑上,VTL与传统磁带库组成了原有系统中的磁带库,但是把所有虚拟磁带库的优点都集成进来。

    在这种情况下,VTL只是通过备份软件把数据块取出,然后模拟成磁带格式将其放到磁盘上,但并不知道数据块中究竟是什么内容。

    应用第二步:革掉D2D的命

    在图3的情况,VTL的应用发生巨大改变?它特别为存储备份数据而建立了客户化文件系统,该文件系统可以完成快照、复制、指针和各种磁带不能完成的事情。在这种应用情况,VTL完全代替了传统的D2D系统。

    这个时候,一旦写完备份后,VTL会检查所写影像,并识别影像的内容。此外,还要决定备份的类型、备份包含的文件(或其他项目)和文件的来源。在这些全部完成后,他们需要建立一个内部数据库??基本上就是备份服务器索引或目录的副本。

    VTL不仅代替了D2D系统,还对用户整个数据保护流程进行了变革,在此之前,业务系统数据传送给镜像系统,之后的数据保护工作由镜像系统完成,而采用VTL代替D2D之后,业务系统把数据传输给由VTL和磁带库组成的数据保护系统,由后者完成整个数据保护工作。

    产品篇

    如前文所提到的那样,VTL首先出现在大型机环境中,由于该领域相对封闭,而且应用并不普遍,因此本文主要介绍开放系统领域的情况。在开放系统中,VTL产品主要有两类,一类是磁盘库管理服务器,另一类是专用纯硬件虚拟磁带库。

    磁盘库管理服务器

    为了提高VTL备份的应用安全性,部分供应商开始将各色软件VTL模块装入专用服务器(一般称为“磁盘库管理服务器”),或将操作系统和软件VTL模块“固化”在“磁盘库控制器”内。该类型VTL具备“准硬件”包装,但备份磁盘的应用仍受限于文件系统。这种软件硬件化的VTL方案实现了备份管理系统和虚拟磁带模块的解耦,在一定程度上提高了备份数据的安全性,可以作为外设独立使用。但是,核心控制部分仍旧是通过操作系统,逻辑地模拟磁盘的线性化,因此存在一定缺陷。

    智能化专用纯硬件虚拟磁带库

    2003年,国内著名的存储备份设备制造厂商SOUL推出了具有自主知识产权的智能化虚拟磁带库产品?SureSave VTL。该产品采用自主研发的专用VTL控制器,屏弃了PC服务器架构VTL带来的诸多问题。采用硬件压缩技术,具备多项专利。集专业、安全、智能于一体的设计理念,该产品的出现推动了新一代虚拟磁带库技术的发展。

    智能化是SureSave VTL的亮点,使它区别于其他产品走在VTL技术的前列:中文GUI图形管理界面、备份服务器灾难恢复、备份数据Online可视化、模拟NAS、模拟裸磁盘、异地归档等多种功能使虚拟磁带库的可用性一再提升,一些业内人士认为,SureSave VTL的成功应用,是虚拟磁带库技术成熟的标志。