VTL(虚拟磁带库)技术的未来

对于广大用户来说"数据就是金钱、备份就是生命",重要的数据必然需要得到安全完好的保护。目前,保护数据安全的主要手段是对数据进行定期的备份。而在备份设备的选择上,以磁带为主的各种传统备份产品已无法满足用户的上述需求,越来越多的用户正在采用磁盘或磁盘与磁带混合的方式来满足数据保护需求。

VTL技术的出现是为了解决具体的备份问题。下面我们就来看看它在哪些领域取得了实质性的改进。

系统扩展性

不仅仅只有大型企业才会遇到可扩展性的问题,中小企业(SMB)也有类似的需求。在VTL市场发展的早期阶段,只有极少数的产品能够在扩展性方面满足企业的要求。但是现在不同了,有好多产品可以任意地向高端扩展系统规模或者向低端缩减配置。除了Copan Systems、IBM、NEC(美国)以及Sepaton等几个少数公司以外,其他所有的VTL / IDT厂商都能提供针对中小企业的产品。现在,价格在5,000美元以内的低端VTL和IDTs设备能为用户提供许多以前只有在高端产品中才具备的功能。此前,各厂商的产品策略看起来都很保守,所以这些为SMB市场开发的VTL/IDT产品的出现是一个标志,说明各厂商在规划产品线方面思路有了明显的改变。

中型企业每晚的备份数据量一般在20TB到40TB之间,目前几乎所有的VTL厂商都能提供这个级别的产品。处理这样的备份数据量,VTL系统需要具备500~1000 MBps的吞吐能力。“VTL/IDT产品列表”中所有的产品都具备这样的性能。

高端企业用户(每天的备份数据量超过40TB)可选择的产品相对较少。拥有海量数据的用户一般都是通过光纤网络(FC SAN)连接它们的大型服务器,并且使用LAN_Free的备份模式。这样的用户很少考虑用IP网络传输备份数据,因此,定位在高端企业细分市场的产品必须支持光纤通道接口。

高端市场选择面较窄的另一个原因是大多数产品都缺乏全局重复数据删除功能。如果要在一夜之间备份完100TB的数据,则必须具有2,300 MBps的吞吐能力。没有人希望同时使用维护三个独立的备份设备,并将100TB数据分成三份处理,而每个设备一晚只能处理40TB,这样做也是不合适的。用户需要的是一个用FC通道承担这种负荷的单一系统,而不是将备份任务拆分到多个设备处理。目前,只有少数公司的产品具备这种能力,其中包括:FalconStor Software(飞康)和Sepaton两家公司,以及他们各自的OEM合作伙伴——Copan系统公司、Sun和惠普。另外,NEC的产品Hydrastor尽管没有提供光纤通道接口,但实际上它却具有更高的带宽吞吐能力。如果用户只需要光纤通道的高带宽,而不需要重复数据删除功能的话,EMC、富士通、Gresham等公司的产品同样可以选择。

很明显,上面列举的名字中缺少了EMC /Data Domain的产品。他们的FC通道VTL最快速度达到900 MBps,而且Data Domain的DDX系列有着比此高得多的速率。但实际上它只是将16个独立的DDR单元放置在一个机柜中,数据去重功能也并没有整合在一起。Data Domain目前尚不支持全局重复数据删除,尽管该公司宣称此项计划已经列入了roadmap,但截止到目前,还没有任何迹象表明他们何时能发布这个新功能。

易用性

各类VTL和IDT产品在易用性方面差异极大,有些使用起来“简单得难以置信”;而另一些则非常的复杂,以至于“我们简直不能相信这样的产品竟然通过了各种功能测试。”让我们欣慰的是,大部分产品的易用性非常好。不过需要注意一点,各家产品之间易用性的概念还是有一定的差异。因此当我们对某些产品感兴趣的时候,还是应该做一下概念验证测试。

与备份软件集成

所有的VTL和IDT设备都可以同市面上流行的各类备份软件兼容,其中大部分还带有硬件数据复制功能,实现两个VTL设备之间的数据复制。但是目前只有极少数产品能够做到与备份软件紧密集成,实现对远程复制数据的直接管理 — 利用远程数据进行直接恢复或者将远程数据导出到磁带介质。

赛门铁克的备份软件NetBackup提供了一个解决以上问题的方案:OpenStorage(OST)API。有了这个API,备份目标设备就不再单纯扮演虚拟磁带或文件系统的角色。备份任务首先指定目标设备,一旦数据写入磁盘,NetBackup就能够驱动IDT设备进行数据复制,复制完成后,IDT设备将结果返回给NetBackup。像这样,NetBackup可以对复制的数据进行管理,也可以为复制数据创建一个基于磁带介质的副本。整个过程会自动产生一份本地磁盘备份、一份远程同步的磁盘备份和一份远程导出的磁带备份。由于是通过备份软件实现了远程设备管理,所以不需要任何人操作磁带设备。目前,仅有Data Domain、飞康和昆腾等少数几个公司支持这个API。其中Data Domain和昆腾的设备要使用该API,还必须用IP网络作为数据传输通道;而基于光纤通道支持该API的,就只有飞康一家。

CommVault备份软件也有一个与之类似的功能。不同的是,它需要用NAS设备以IDT的形式作为备份目标,不支持虚拟磁带库。CommVault利用一个介质代理程序跟踪复制目标NAS的文件目录的数据改变,介质代理与CommServe( CommVault的备份服务器程序)保持通讯,并向CommServe传送远程复制的结果,以及复制数据是否可用的状态信息。如果该介质代理安装在远程的装置中,用户还可以利用该程序将远程备份数据导出到磁带上,创建一个磁带副本。

还有一个具备此类技术的厂商是惠普,他的Data Protector备份软件和VLS虚拟磁带库提供了类似的功能。主要的部分与CommVault技术类似,唯一的不同是Data Protector使用了一个完全独立的备份服务器(具备独立索引)来监测虚拟磁带之间的数据复制。一旦发现新的“磁带”被复制,远端的备份服务器会请求与本地的备份服务器同步索引信息。因此,任何一端的备份服务器都能够同时管理两端的虚拟磁带,也能为复制的虚拟磁带创建物理磁带副本。

“VTL软件”和“硬件VTL”的比较

所有硬件装置的核心都是软件系统,因此VTL软件同硬件VTL之间的差异主要表现在产品形态上,而不是技术方面。用户需要面对的问题是:直接采用软硬集成的产品?还是自己来选择软、硬件的组合。多数VTL和IDT设备都是厂商打包好的集成产品,但也有一些例外,比如飞康和Gresham就单独销售软件。

用户可以购买已经配好硬盘的VTL/IDT,或者选择自己添加硬盘设备。后一种情况的选择范围包括独立的软件产品、以及Data Domain和IBM等厂商提供的网关类产品。

VTL与磁带库的互操作

市场上有一种期望是VTL装置可以与物理磁带库直连并且集成在一起使用。不过用户对这种整合的期望已经减少了很多,因为他们现在对重复数据删除技术更有兴趣。VTL与物理磁带库集成的意义在于数据从磁盘到磁带之间有一个存储空间用来过渡,还可以节省磁盘数量,降低成本。但是有了重复数据删除之后,这样做的意义就不大了。支持与物理磁带库集成的产品包括飞康、富士通,Gresham、HP和昆腾。

IDT和 VTL的比较

到底是选择将数据备份到文件系统设备(IDT)还是备份到虚拟磁带库?其实完全看用户个人的喜好。如果希望用光纤通道来传输数据,那选择很容易,因为IDT和VTL都可以支持FC端口;但是,如果你希望设备有更好的扩展性和数据去重功能,那目前还只能选择VTL。

IDT设备使用文件系统存储数据,它主要有两个优势:第一,发起新备份时旧的备份自动过期,能够立即回收空间;第二,可以同时进行读写操作。这两个特性是虚拟磁带库所不具备的。

当我们在IDT设备中删除文件时,空间会自动回收。但在VTL中不会这样处理,因为它不能自动识别(虚拟)磁带是否过期,用户只能手动标记过期的磁带。只有VTL看到(虚拟)磁带头部分有新的标记,它才认为该磁带已经过期,上面的旧数据可以被覆盖了。

用IDT做备份目标时,文件系统是可以同时读写的;但虚拟磁带不行。如果一个备份进程正在向一盘虚拟磁带写入数据,那么此时其他进程就无法读取该磁带的数据,也就是说我们没办法同时做数据恢复或介质拷贝。然而,这样的情况只有在用户同时进行备份和恢复(拷贝)操作时才可能发生。如果使用较小的虚拟磁带,那么发生磁带争用的概率就更低了。

虚拟磁带库技术一直在不断的演进和扩展。但现在,仅仅做VTL恐怕是不够了,随着更多的用户希望将备份数据复制到异地,业内必须找到一个合适的解决方案以应对来自备份复制的挑战。遗憾的是,近期我们看到的产品更多的是诸如赛门铁克NetBackup OpenStorage以及惠普Data Protector/Virtual Library System之类的软件。

另外的一个预测是:重复数据删除将成为备份软件的基本功能,从而引发市场对IDT设备需求的下降。但是出现此种情况需要一个前提,即使用源端去重技术的备份软件能够解决恢复速度受限的问题。就其技术原理而言,它们一般都是将数据直接备份到远程站点,因此恢复速度不会很快,大概10 MBps到20 MBps之间。这种现状如果不能改变,那么高速磁盘备份设备仍然是市场的主流。

1.为什么重复数据删除功能很少出现在FC存储设备中

对于企业级应用来说,光纤通道(FC)技术必不可少,重复数据删除也同样重要。但是,如果我们想在一个备份装置中同时使用这两种技术的话,VTL是目前唯一的实现方案。那为什么不能在一个FC存储的LUN上实现去重功能呢?我只能说:“它看似简单,要做却难得多。”

通常,我们在LUN上要创建自己的文件系统,可是常用的Windows、Linux、Solaris、HP – UX、AIX以及MacOS等操作系统所带的文件系统是完全不兼容的。于是乎,我们不得不在众多的文件系统平台上测试所有格式的备份数据。想想吧,这个测试的难度有多大!

不过,现在有人已经接近成功了。GreenBytes公司将在他的GB-X系列存储产品中提供基于iSCSI LUN的重复数据删除功能。