虚拟带库非主流?绿色节能的新一代VTL技术概述

DoSTOR存储分析 12月18日北京消息:随着全球VTL市场的升温,国内业内及广大用户对VTL的兴趣也越来越浓,可是,受到多年来传统磁带备份的销售和使用惯性影响,业界及用户对于VTL这种新兴的技术还存在诸多疑问:VTL是否能够完全取代传统的物理磁带备份?二者是否可以相结合,会出现什么问题?是否能够满足当今绿色节能的市场要求?

VTL虚拟磁带库可以通过模拟SCSI指令的方式,将磁盘仿真为行业标准的磁带设备,从而在不改变原来磁带备份架构的情况下,用磁盘代替磁带,以缩短备份窗口、提高备份成功率、缩短恢复时间、提升读取归档数据的效率。

物理磁带设备无法完全取代

对于前端的备份服务器来说,VTL系统利用磁盘仿真的空间和物理磁带设备是完全一样的,因此从表面上看,VTL是可以在很大程度上代替物理磁带的。但是,对于一些企业,物理磁带还必需存在。

首先,基于长期归档的需求。越来越多的企事业单位受到信息法规的要求,企事业单位的数据必须保存够一定期限,而一般磁盘系统的保留期限只有3年左右,如果需要保留更长时间,其可靠性就无法保证了。而且随着产品的更新换代,维护成本也会大幅提高。如果要将数据在磁盘上保存5-7年或更长年限,每隔3年就要更新一次设备,这样不但花费巨大,数据迁移工作也是非常繁复。相比之下,磁带介质的保存周期就长得多了,单位成本也更适用于超过5年的长期归档需求。

其次,基于法规遵从的需求。目前,许多数据的稽核工作仍要求必须检查位于磁带上的数据,而不是磁盘上的。某些法规甚至还要求特定数据必须保存在不可改写的介质上,以防止事后造假涂改。目前几乎所有磁带产品都能提供针对这类"一次写、多次读"需求的WORM介质,可说技术相当成熟,更为重要的是这些产品已经获得有关政府部门的认可,使用上没有任何障碍。

与磁带产品相比,目前只有很少数的磁盘厂商可以提供“一次写入不可更改”的技术,而要获得这项功能,就要付出比WORM磁带昂贵得多的成本,另外,市场对WORM磁盘的接受程度也比较有限。

第三,从数据生命周期方面考虑。虽然磁盘的成本不断下降,但从磁盘有效的使用时间考虑,磁盘的单位使用成本还是高于磁带。随着数据量的不断膨胀,无限制的购买磁盘用来储存数据,显然不是个好的解决办法。反之,基于数据性质的不同,将数据分别放置在不同速度、价格的存储介质上,才是更为合理的作法。而磁带成本低廉的特性,十分适合作为整个存储系统的最末端,用于存放那此备份时间最久、访问机率最低的数据。

VTL与物理磁带设备结合使用

通过上面的介绍可知,对于有长期归档、法规遵从,或是数据量庞大、必须考虑实施生命周期管理的企业来说,物理磁带不可取代。但这并不表示VTL与物理磁带之间不能共存,要让VTL与物理磁带相辅相成,才能使用户获得最大的利益。

首先,VTL可以作为后端物理磁带的缓冲,使备份窗口缩短。所有备份数据将先写入速度较快的VTL,然后再利用其它时间迁移到物理磁带。这样,即使迁移到物理磁带的速度较慢,也不会影响到前端的系统运行。

其次,将VTL与物理磁带相结合,可以轻松的实现数据生命周期管理。多数使用经验表明,越是新的数据,恢复、访问的机率就越高,因此,可以根据设定的备份策略,将一定期限内的数据继续保留在速度较快、可靠性较高的VTL上,以满足快速恢复的需求。那些超过一定期限的数据,可以通过设定自动的迁移到磁带上,以空出更多VTL空间,保存新的备份数据。

VTL与物理磁带结合使用的几个问题

虽然VTL结合磁带使用有很多益处,但在实际应用过程中,还是会遇到一些问题。

VTL的性能限制

如果单从顺序存取速度来看,当前的高速磁带机的传输速度并不亚于磁盘阵列,而大型的磁带库还能利用多数据流并行备份的方式,提高写入速度。但由于磁带只能顺序存取,如果要恢复整卷磁带中的某个指定文件,则必须从头倒带到指定位置,就会花费大量时间。

相比之下,VTL的实体是磁盘阵列,由于磁盘属于可随机存取的介质,可以随时读取磁盘中的任意位置,恢复指定数据的速度远远高于磁带。另一个更大的优势在于,VTL仿真的磁带驱动器,可以支持多数量的读写头,因此执行多数据流并行备份时,不会受到读写头数量的限制。一套VTL可以同时连接多部备份服务器,同时执行多组备份程序,大幅缩短了备份时间。

导出物理磁带的操作会占用备份服务器资源

在VTL结合磁带的架构下,VTL 处于缓冲的角色,数据最终还是要迁移到后端的磁带上,但是如何执行数据迁移到磁带非常关键。

传统的方法是利用前端备份服务器的备份软件,执行数据迁移。通常分为两种:一种是先把数据从VTL恢复到备份服务器,然后再迁移到磁带设备;另一种则是通过备份软件的磁带复制功能来实现。从备份软件看来,VTL仿真出的磁带和物理磁带没什么不同,因此可以事先在VTL上设定与物理磁带相同规格的虚拟磁带,然后再以磁带复制功能,将VTL中的数据出库到物理磁带。

无论是哪种方式,都需要通过前端的备份服务器进行,因此会占用备份服务器的运行时间与处理资源,当备份服务器执行数据迁移操作时,就没办法保证原来正常的备份工作。而当前企业的数据量都很大,对业务持续运行的要求也很高,占用备份服务器的时间和资源来执行数据迁移恐怕不能被企业接受。

容量瓶颈

由于VTL是作为物理磁带的缓冲,所以VTL的容量越大,保存在VTL磁盘中的备份数据也就越多,在需要恢复数据时,从后端的磁带中搜索数据的机率就会降低,恢复的效率也会大幅提高。

虽然多数VTL产品都预留了扩展容量的空间,但比起可能通过购买新磁带无限扩展容量的磁带设备,VTL的容易仍是相当有限。为了解决容量问题,用户通常会通过策略设定,只在VTL中保留1个月以内的备份数据,超过时限的数据就迁移到磁带上,把VTL的空间让给新的备份数据。但对于许多要求每天都执行全备份的用户来说,1个月的数据还是需要非常大的磁盘空间。因此,要么用户就给VTL购买极大的容量,要么就只能减少VTL上备份数据的保留天数,而这样则必须更频繁的执行数据迁移。

VTL需要持续运行,难以节电

与磁带设备相比,VTL虽然有性能及可靠性上的优势,但就当前越来越受到重视的环保节能方面来看,却处于劣势。磁带库、自动上带机之类的磁带设备内部的主要零件都是机械装置,机械手臂、磁带匣转盘、磁带机头等部件,都只有在实际工作时才会被驱动,平时则处在待命状态,所消耗的功率极低;而且,多数企业只有在下班等非高峰时间才会启动磁带设备执行备份,因此磁带设备一天中几乎只有8-10多个小时是全功率运行的。

相比之下,VTL的磁带阵列就必须保持不间断的运行,尤其是像控制器、风扇等部件的供电都是不能中断的,虽然也可以平时将VTL关机,等要备份/恢复的时候再开机,但这样一来重新开机需要时间,而且原先设定好的VTL在关机后就会从备份服务器的备份装置中离线,VTL重新启动后,需要重新刷新备份服务器才可以使VTL重新在线,这也会浪费时间。

VTL的新兴技术从容应对诸多难题

为了解决上述的问题,各主流VTL厂商都在新一代产品上结合了新的技术,以弥补VTL运行或与磁带配合时产生的种种不足。

磁盘负载平衡与硬件压缩-性能大幅提升

传统VTL仿真出的磁带通常在磁盘的固定位置,在某些情况下可能会发生许多的备份数据流集中到一个磁盘的问题,因此有些厂商,如飞康、NetApp等,在VTL上改用动态的I/O分配技术,虚拟磁带并不位于固定的位置,系统可以自动分配备份数据流写入磁盘阵列的位置,备份数据流可以动态的平均分布在多个磁盘LUN,以避免形成磁盘LUN瓶颈。

另外,由于软件压缩会造成处理器的负担,从而降低VTL的整体性能。某些情况下,启用软件压缩可能会使VTL的吞吐量降低一半,如果对不易压缩的分散数据使用软件压缩,VTL的吞吐量甚至会下降85%。为了解决这一问题,利用专用的压缩卡提供硬件压缩已是目前的趋势,如此可以在不影响处理器性能的情况下执行硬件s压缩,吞吐量也可以数倍于软件压缩的VTL。

磁带直接出库 – 数据迁移更灵活

为了应对传统VTL向物理磁带迁移数据的性能影响问题,多家VTL厂商纷纷推出了"磁带直接出库(direct tape export)"或称为"无服务器磁带备份(Server-less tape backup)"的功能。用户可以利用这一功能直接从VTL把数据导出到后端的物理磁带,不用占用前端备份服务器的资源,也不会干扰到备份服务器原来排定的备份工作。

在这种模式下,VTL本身也形同于一台备份服务器,可以支持各种磁带设备,并执行迁移数据的备份工作。目前飞康、NetApp、EMC、昆腾等厂商已经能够提供支持直接出库功能的VTL产品,而飞康和NetApp的产品还能提供更精细的设定。当VTL上的数据导出到物理磁带后,这卷理论上已经被导出的磁带数据仍然可以经过设定保留在系统上一段时间,如果在这段时间内需要恢复该卷磁带的数据,可直接从速度更快的VTL中读取,就不用去找物理磁带了。

重复数据删除技术 -容量效率倍增

重复数据删除技术可以利用对原始数据的分解与特征值演算,去除数据中的冗余部分,让有限的存储空间发挥数倍甚至数十倍(以应用为准)的存储效率,大幅提高磁盘有效的存储容量利用。而对VTL来说,由于可容纳的数据量增多,用户原来每隔几天或每周就要执行一次的出库到磁带的操作,可以改为间隔1个月甚至是半年之久。由于保留在硬盘上的数据量增多,也提高了数据恢复和检索的速度。

VTL结合重复数据删除技术是当前相关厂商竞相投入的焦点,EMC、飞康、昆腾、Data Domain、Diligent、Sepaton等厂商都已有相关产品销售。

MAID技术

MAID(Massive Arrays of Idle Disks)的概念就是以RAID群组为单位,让磁盘阵列中的磁盘只在实际使用时才全速运转,平时在闲置的时候则可以把速度降下来,以达到省电的目的。根据厂商公布的装饰,MAID可以让磁盘阵列节省电能达20-30%.

而VTL的硬件底层是磁盘阵列,因此部署MAID技术并没有太大的问题,而利用MAID也能消除磁盘耗电较高的缺点,目前已有Copan等厂商推出了具有MAID功能的VTL。