磁带忍辱负重 迎来第二春

最近几年来,磁带一直处于生死挣扎的边缘——但如今它似乎又迎来了自己的第二春。经历了过去五年多之中磁盘拥护者们的口诛笔伐、忍受长久以来磁盘重复数据删除技术的轮翻轰炸,这些极具针对性的攻势确实给磁带造成严重的负面影响。然而磁带的价格远低于磁盘,其可靠性也更为出色;最重要的一点,磁带的存储容量即将迎来新一轮飞跃。

事实上,IBM公司最近正准备将LTO-6的存储容量一举提升接近四十倍,相比之下磁盘产品的容量增长速度显然要慢得多。

磁带迎来第二春 巨头谷歌依然青睐磁带

磁带是我们目前能够拿出的惟一有机会跟上数据量增长速度的存储介质。各类事务、图像、音乐再加上合规性需求、社交媒体会话以及设备对设备消息已经成为IT系统日常运行的必然产物。当然,在这些数据访问频率较高时我们仍然需要利用闪存及磁盘进行存储,但当这些数据逐渐过时、变得冷门之后,我们只能把其中需要保存的部分交给磁带了。

现状

作为曾经的备份介质,磁带如今已经成为归档领域的主力。与此同时,随着数据总量的爆炸式增长,归档体系对存储空间的需求也水涨船高。

过去市场上出现过十几种各不相同的磁带及卷轴格式,将数据写入到磁带中的方式也多种多样,但目前仍在使用的只有三大类,分别为:IBM机制、LTO机制以及甲骨文机制,惠普的DAT虽然仍有一定影响力、但已经严重衰落。

IBM的专有TS1140格式能够在一卷磁带上提供高达4TB的原始数据存储容量,而且蓝色巨人还推出了一系列配备磁带库、帮助用户使用这些存储设备。其中包括拥有15000个磁带接口的高端TS 3500,这套设备由机器人负责拾取磁带盒并将其插入驱动器,数据经过压缩后的总容量可达2.7 EB(即艾字节)。虽然甲骨文在收购了Sun/StorageTek公司后获得了雄厚的技术实力与稳固的生存空间,但大型机的磁带业务仍然是IBM一家独大。

磁带迎来第二春 巨头谷歌依然青睐磁带

甲骨文T10000驱动器

第二种仍然幸存的专有磁带格式来自甲骨文公司。其T10000d能够容纳8.5TB原始数据,而且与IBM类似,甲骨文同样为其高端StreamLine 8500高端产品提供一系列配备库。甲骨文的单一系统中包含有一千多卷磁带,并通过将十套系统并联起来构建起由一万多卷磁带组成的超级存储体系。目前最知名的甲骨文产品客户当数谷歌公司。

LTO-6磁带

LTO的全称为线性磁带开放协议,由惠普、IBM及希捷三家公司共同开发,最初于2000年8月由IBM推向市场。

当时的想法在于为配备介质及驱动器产品的Windows及Unix服务器创建一种开放磁带格式,并让三者之间能够随意相互更换。这一优秀技术方案的出现给其它机制带来了毁灭性的打击,倒在其铁拳之下的专有磁带格式包括DLT、Super-AIT以及VXA等等。

随着竞争对手的相继崩溃,LTO成为笑到最后的王者。昆腾公司于2005年通过收购Certance(即希捷旗下的前磁带部门)加入了LTO阵营。目前只有IBM与惠普两家仍在生产磁带驱动器,昆腾只销售LTO驱动器但并不从事制造工作。

IBM、甲骨文、惠普/昆腾是当前磁带库领域的三大主要供应商,紧随其后的是SpectraLogic公司。谈到磁带的再度复兴,Spectra曾于2012年下半年推出过容量达550PB的磁带存储产品。

磁带原本只是一种顺序存取介质,但IBM已经为其开发出一套虚拟文件:文件夹访问系统,也就是LTFS(即线性磁带文件系统)。这套系统允许用户通过与Windows类似的文件:文件夹拖拽操作从磁带中读取并写入文件。

这意味着普通用户在理论上能够在无需涉及备份软件包的前提下在磁带上完成文件的写入与读取,且每项操作都提供独立的用户界面。这有望彻底改变磁带的使用方式,从而令其访问真正走近我们普通人身边。

这就是目前处于运行当中的磁带技术。但未来还有哪些值得期待的新亮点?

未来趋势

前面提到的三大主流格式各自拥有路线图,分别指向未来的一到两代产品。未来产品的总体关注重点分为两大方面,一者为提高容量、二者为增加数据传输速度。举例来说,LTO供应商目前推出的是LTO-6产品,也就是最新一代。后续将逐步与我们见面的则是LTO-7与LTO-8。

磁带迎来第二春 巨头谷歌依然青睐磁带

二者在容量与速度方面均得到显著提升。LTO-7提供6.4TB原始数据容量(按2.5:1的常见比例进行压缩后,实际存储空间为16TB);原始数据传输速度则为315MB每秒,远高于LTO-6的210MB每秒。LTO-8应该能够带来12.8TB的容量以及427MB每秒的传输速度,而且二项数值均来自原始数据。

一般来说,新旧两代产品之间的相隔周期约为三十个月,事实也基本证明了这一点。从历史角度看,每一代LTO驱动器都能够在写入方面向下兼容前两代驱动器,而在读取方面则能够向下兼容前三代驱动器,这样就简化了用户向最新格式方案进行迁移的流程。

我们预计未来几代LTO,例如LTO-9与LTO-10,与前代产品相比将在传输速度与容量方面迎来倍增,这也正是LTO联盟努力打造下的结果。

甲骨文对于自家T10000格式也准备了类似的路线图。即将面世的T10000e将提供12-20TB容量,传输速度在每秒400MB到600MB之间——不过我们认为每秒300MB到350MB应该更为可信。可以肯定的是,甲骨文在面对实际客户时会给出更为精确的数字。

IBM呢?虽然蓝色巨人并未着力宣传,但我们确信其方针也不会有太大区别。我们同时预计,IBM的TS1150与TS1170格式与现有TS1140相比,基本上会在容量及传输速度上迎来倍增。

IBM已经展示了一套原始容量达35TB的磁带,而目前他们正积极筹备公布一款仍旧沿用现有钡铁氧体磁带介质(注意,绝不是什么新型记录技术)创建的125TB磁带产品。假如IBM的消息确实可靠,那么搭载该磁带的TS3500库将能够容纳总计84 EB数据。这样的存储能力实在令人为之目眩,而且其每GB使用成本将把市场上的所有存储竞争对手远远甩在身后——没错,是远远。

假设LTO能保持每三十个月左右实现传输速度及容量倍增,那么我们在12年到13年之内(也就是2025到2026年)就会迎来容量达102TB的LTO-11。

说到这里,大家一定会起疑:如何判断我们的猜测属于合理推断而非痴人说梦?这是因为磁带中保存1 bit数据所使用的物理尺寸要远远大于磁盘产品。简单来说,磁带上可资利用的物理空间更大,而且缩小物理尺寸之后磁带上数据信息的稳定性不会受到影响——事实上,这与新近兴起的PMR磁盘记录技术非常类似,该技术正是在竞争压力之下所诞生。125TB磁带项目包含两条发展途径,其一为缩小磁带的bit尺寸,其二则是将存储密度提升至每平方英寸100Gb——相比之下,目前最先进的高密度磁盘也只能带来每平方英寸620Gb到690Gb存储容量。

在本文中,我们不打算详细讨论DAT。随着磁盘及云备份的全面崛起,它的悲惨命运已经注定、毫无回转余地。

磁带是一种归档介质,目前常被规模最大的数据归档服务商用于处理此类工作,其中最典型的代表就是谷歌与Amazon。