磁带峰会看好归档前景 磁带业或将复兴

最近在内华达州结束的磁带峰会上,最关键的消息是磁带不仅仅会复苏,更会复兴,很多人会觉得这有悖于常理,我们来探究一下为什么会有这样的预言,如果被证明这是真的,IT行业将成为主要的受益者。

Tape Summit 2011是由磁带及相关厂商,以及熟悉磁带市场的分析师和新闻媒体发起的一个大会,今年在内华达州的拉斯维加斯举行,在此之前,许多厂商也参加了国家广播协会(NAB)举办的大会,虽然大家对磁带带有偏见,但也有诸如惠普、IBM和昆腾等厂商在同时销售硬盘和磁带,因此,即使磁带的优点被一再强调,与会者认为硬盘在越来越大的存储市场更有作为。

如果笔者没记错的话,早在1961年IBM的Ed Childers就第一个宣称“磁带已死”,如果事实果真如此的话,我们现在应该纪念磁带死亡50周年了。虽然Ed Childers的话没有应验,但这50年来,磁带市场一直在缩小,今天磁带的两个主要用途是备份和归档,令磁带厂商不安的是,现在硬盘厂商也瞄上了这两块市场。

首先,在备份市场,磁盘到磁盘备份方案变得越来越流行,特别是那些使用了重复数据删除技术的领域,有许多原因证明磁盘在构筑第一条防线时作用更加重要,导致许多人预言磁带在备份市场中将变得无足轻重,当然这不可能是真的。

AT&T存储规划和设计架构师Jonathan Marianu在他庞大的备份世界中同时使用了磁盘和磁带,需要删除重复数据时,他使用磁盘,但他也使用了大量的磁带,其中一个原因是没有足够的带宽向灾难恢复设施复制数据,鉴于是AT&T的业务,可以想象数据量是非常大的。

Google最近也提出了从离线磁带进行Gmail恢复的想法,这是一个逻辑难题,因为离线磁带是不受制于逻辑数据保护的,但这说明了在数据保护方面的一个重要观点,那就是最好能恢复数据,即使要花很长的时间,也比不能恢复要强很多。

磁带在备份市场的表现并不能让磁带厂商兴奋,真正让他们兴奋的是归档市场。

归档是将固定的内容数据从生产系统转移走的过程,注意,归档副本是一个有效的生产数据副本,而不是一个数据保护副本。

现在,人们倾向于将归档划分为活动归档和深度归档,活动归档数据很容易实现联机访问(最终用户可以读取和用于商业目的),深度归档通常是离线的,必须由系统管理员检索信息。

第一个要问的问题是,一个归档可以或应该容纳多少数据?答案是几乎全部,据粗略估计,80%的归档数据都是已固定的内容,很可能这个数字还估小了,大量数据在创建后就立即固定了,如发送或接收的电子邮件,或数字医疗影像等,大部分非结构化数据(它构成了许多企业最大的增长区)也是固定的,未完成的事务(结构化数据)或一个未完成的字处理文档(半结构化数据)不是固定的内容,一般来说,数据库中的数据,服务器上的文件是不大可能发生变化的,因此大多数组织的绝大部分数据都可以进行归档。

第二个问题是:为什么还没有数据被归档?原因有很多,首先,归档意味着需要良好的数据保留管理策略,对许多企业来说,这是难以实现的,笔者只想说数据保留是极少的,除了某些在磁带上执行的深归档。

但磁带受限于深归档吗?昆腾和扩斯达(Qualstar)已经有结合使用磁带和磁盘缓存的活动归档产品,不过,活动归档通常是驻留在磁盘上的。

Spectra Logic产品管理和全球营销副总裁Molly Rector提出了惊人的言论,他说5%的数据是活动生产数据,15-20%可能是活动归档数据,出于性能方面的考虑,需要放到SATA硬盘上,剩下的是可以放到磁带上的活动归档数据(部分数据可能是深归档数据,但它所占的百分比可能很小),这是一个令人震惊的评论,这意味着数据中心的大部分数据都应该放到磁带上!当然,这引起了许多争论,但如果这是真的,岂不是会促使磁带技术和磁带厂商走上复兴之路?

但这可能成真吗?这会带来什么经济效益?磁带能胜任这项工作吗?

Clipper集团发表了一份题为“长效归档解决方案研究 – 磁带比磁盘更具优势”的白皮书,这份白皮书讨论了数字化数据的长期保留,得出了一个惊人的结论,基于磁盘的解决方案的成本是磁带的15倍!这份白皮书假设充分,论述详尽,如果站在它的立场,磁带对归档数据来说拥有很好的TCO.

但是,其它因素在这场争论中也发挥了作用,包括可靠性、可扩展性、寿命、服从、安全和可用性,可扩展性对磁带来说没有问题,服从和安全看起来也没有障碍,寿命似乎也没有问题,现代磁带盒有望保存15-30年,这个时间完全可以满足绝大多数迁移周期需要 – 要从一种介质将数据迁移到新介质间隔的时间,使用磁带,这个时间是7-10年,一般来说,LTO(开放系统磁带最流行的格式)每隔2-3年就会出一代新产品,最新一代LTO可以向后兼容两代磁带产品。

通常情况下,在新一代磁带到位之前,我们需要迁移最旧的磁带,与硬盘相比,迁移周期大约是3-4年,这并不意味着硬盘的寿命要长4年,但从经济上考虑,每隔3-4年买新的硬盘是最划算的(相同的钱可以买更多的容量,维修成本也更低)。你可能经常看到一个10年前的磁带库运行着7年前的磁带,但不大可能看到7年前的硬盘现在仍在服役,更别说10年了(顺便说一下,操作系统和应用程序更新换代也会影响到迁移时间,但通常会被忽略,因为它们会同时影响到磁盘和磁带)。

一个关键问题是磁带的可靠性,Horison信息战略家Fred Moore在他题为“磁带和磁盘介质在数据中心未来作用的预言”的演讲中讨论了这个主题,现在Fred的绰号很可能是“磁带先生”,但更有可能被称为“存储先生”,因为他的分析非常合乎逻辑,无可挑剔,如果你想了解相关的细节信息,请参考“磁带技术飞跃到第3时代”.

Fred没有过多地描述一些厂商展示的提高磁带完整性的方法,需要注意的是,对比必须拿今天的磁带和今天的硬盘技术进行比较,而不是拿上一代或上几代磁带进行比较。

另一个需要考虑的关键问题是可用性和LTO-5的长效文件系统(LTFS),LTO-5有两个分区:分区0可以容纳目录结构信息,分区1容纳内容信息。LTFS可以利用目录结构信息更有效地管理磁带,这对管理活动归档环境中的磁带提供了巨大的帮助,LTFS还提供了其它优点,如自描述磁带,目的是为了将来如果需要,可以使用XML读取文件,即使创建文件的原生应用程序不能再读取它。

总的说来,磁带峰会演讲人就LTFS和它的优点谈了很久,尤其是许多参加NAB大会的厂商在谈起使用磁带的LTFS功能时,引起了广播行业客户的极大兴趣,一个很有说服力的例子是工作流的归档,笔者以为“工作流”和“归档”是矛盾的说法,但错了,现代电影制作的每一步和后期制作过程,磁带都可以扮演重要的角色。

磁带创新看起来是另一个矛盾的说法,但我们已经看到,实际上不是,在这个讨论中,笔者尽量避开厂商的名字(以免有偏爱某一个的嫌疑),但至少会提到一些,首先,有两个组织在促进磁带的发展 – 活动归档联盟和LTO协会,他俩具有很好的代表性。笔者曾与下面这些厂商进行交流:

·Crossroads – 除了它的磁带监控和分析功能外,它计划利用LTFS开发网络附加磁带文件存储。

·Gresham – 它的强项是TSM环境中的磁带管理。

·惠普 – 磁带继续是焦点,并会积极推进LTFS的使用。

·IBM – LTFS的忠实用户,扩展磁带管理自动化的发起者。

·QualStar – 它的归档管理软件已经支持磁带环境活动归档很长时间了。

·昆腾 – 磁带管理自动化,使用磁带进行活动归档(StorNext)是昆腾很古老的技术了。

·Spectra Logic – 它是磁带技术的创新者,为磁带引入了数据验证功能。

·Tributary – 后端使用磁带的集成VTL(称为备用虚拟层)的忠实支持者。

笔者在磁带峰会感受到的不是磁盘和磁带的对抗,随机访问设备,无论是HDD,SSD还是其它随机访问技术,在企业中都有至关重要的作用,随机访问存储的持续增长必将有一个光明的未来,磁带已死的说法是站不住脚的。

现在真正需要做好的不仅仅是处理信息的爆炸式增长,还需要保留更长的时间,现在有了更经济的答案,那就是磁带!它不仅可以缓解海量信息存储的压力,对数据长期保留来说也是小菜一碟。

这应该会激起一场信息革命,IT预算可以从存储部分抽取更多分配给其它任务,只要磁带不死,IT就是真正的赢家。