DoSTOR专家观点 给磁带一个机会 也许会有收获

DoSTOR专家观点:本文作者Henry Newman是国外某知名存储网站的资深编辑。在同用户的沟通中发现存储的费用不仅仅来自于驱动器和RAID控制器等设备,设备电耗以及冷却系统同样需要花费数据中心的大量预算。

在线备份商完全错了。

上周的文章(请见:在线备份提供商系统选择谨慎 选择磁盘而不是磁带)指出在线备份提供商广泛采用磁盘来取代磁带,这使我思索如果我们回到不那么讲究利润的1999年会怎么样。仅仅根据采购成本和能源使用成本,这些厂商就可以通过使用磁带库而不是磁盘,节约成本并且提供几乎同样快的–而且可能更可靠的–服务。

对于那些相信SATA(串行ATA接口)将能够减少磁盘成本的人来说,他们应该读一读我在去年写的存储的真实成本(Part1 Part2)这篇文章。如果你希望得到良好的性能和可靠性,那么磁盘并不一定便宜。

看起来在线备份商好像正坚定不移地朝向磁盘备份走去。但是我认为这对于家庭备份、小型企业甚至大型组织的备份来说却不是一个正确的选择,因为磁盘在许多方面都比磁带更加昂贵,而且磁带还有很大的"绿色"优势。一些在线备份厂商正在使用MAID(大规模闲置磁盘阵列)来降低能源成本,但是磁带还是比MAID要更加便宜,甚至将MAID的能耗节省包括进去还是如此。

成本

开始,我们将比较不同厂商所提供的不同技术。被选择的厂商并不是基于任何偏好,而是那些我认为容易在英特网上找到定价的厂商。这些厂商可能没有列出最优的价格,但是其相对价格却很能说明问题。

大型企业IBM的基于磁带库的模块售价38365美元,而扩展单位售价28125美元。这个产品具有6000个槽位,足以容纳非常多的磁带驱动器。如果说我们有20个LTO-4(线性磁带开放协议)驱动器,每个驱动器成本为16710美元,而LTO-4磁带是每盒140美元。那么对于一个模块,15个扩展单位,20个驱动器和6000个磁带来说,其总成本为1634439美元。

未压缩总容量为4.6PB左右,带压缩则为9.2PB。无压缩的每PB成本为357049美元,而带压缩的每PB成本则为178524美元。对于LTO-4来说,根据其规格,压缩比率为2比1。

现在让我们使用标准的针对SATA的RAID(独立磁盘冗余阵列)技术来做同样的事情,因为对于备份以及恢复,英特网堵塞所引起的比性能问题更大。

在磁盘控制器上,我选择Sun公司的StorageTek 6940。这其实是LSI的产品,只不过是由多个厂商贴牌后销售。我将这个磁盘控制器设置为每个控制器12个托盘,每个托盘16个1TB驱动器,那么总共就是192TB,成本为663695美元。

那么使用Sun 6940的每PB成本为3456745美元,而使用LTO-4的无压缩每PB成本为357049美元,带压缩则为178524美元。

这也就是说磁盘比起无压缩的磁带几乎贵10倍。当然,这里还有一些告诫:

  • Sun 6940的带宽为1800MB/秒,而20个未压缩磁带驱动器的带宽为2400MB/秒(20乘以120MB/秒)。
  • 我并没有包括进分层存储管理软件(HSM)的成本,这也是不便宜的,虽然比磁带自动机械臂要便宜许多;我也没有包括进高可靠性磁盘高速缓存的成本,HSM也要使用这种高速缓存来作为缓冲。

能源成本

让我们在磁盘这边再加上另一个必须考虑的成本,那就是能耗。如果我需要一个完整的4.2PB未压缩容量的磁带库用于我的在线备份公司,那么磁带库的能耗几乎可以忽略不计。如果是用SATA驱动器,那么情况就完全不同了。使用4.6PB的SATA磁盘,并使用RAID -6 8+2以提高可靠性,也就是5250个驱动,不包括热备援。如果为了安全,而增加3%的热备援驱动器,那么也就是5355个驱动器,335个磁盘托盘,每个托盘16个驱动器。在SATA驱动器上使用SAS(串行SCSI)接口以提高可靠性,那么就是每个驱动器功率为13瓦特。如果使用标准的SATA接口,那么每个驱动器功率为11.6瓦特。

总功率是:5355个驱动器乘以13瓦特每驱动器+335乘以375瓦特每托盘,也就是195千瓦。我们将单位能耗成本定为每千瓦10美分。

磁盘容量

驱动器数

每个驱动器功率(w)

驱动器和托盘总功率(kw

每千瓦小时成本为10美分

磁盘和托盘年成本

4.6PB

5355

13

195.24

$19.52

$171,030

这还未包括进所产生的热量,而经过计算,我发现是1.45倍于成本。因此,根据目前的电力成本计算,每年总能耗成本为247994美元,而这种成本不会在任何很快的未来内下降。同时,磁盘驱动器还不能压缩数据,而磁带驱动器可以在硬件内自动完成压缩。这对于家庭互联网备份来说是一个比较大的问题,因为大部分数据必须被预先压缩成jpg和mp3格式,因此,最好的比较方法就是将无压缩磁带和无压缩磁盘相进行比较,即使这里可能有一些压缩。

性能

我们大部分人都通过电缆调制解调器或DSL(数字用户线路)连接来从家中或企业连接到互联网。对于实时持续数据传输来说,其速率是在128KB/秒到3MB/秒之间。这也就是说,对于8MB大小的文件传输,如果是最低速率,需要512秒,如果是最高速率,则为21秒。我怀疑我们中有几个人经常使用3MB/秒的下载速率,这还是至少是光缆,而且上传也达不到这个速率。

磁带从拾起、载入到定位的时间大约是69秒。如果你有磁盘高速缓存,那么上传的时候你就不用担心,因为数据先是进入磁盘缓存中然后再被写入表中。真正的问题是下载。

对于这种类型的服务来说,采用两种模式可能更好:大部分情况下,恢复一些文件;如果发生灾难情况,则恢复所有文件。如果我有一些文件,这些文件是随机建立而不是建立在同一个时间的,那么,如果它们不是一次性排队,那么我可能每个文件都会产生一些延迟。但是如果这些文件一次性排队,磁带驱动器可用且所有文件都流入,那么我只有69秒的延迟。69秒钟后,等磁带开始传输数据,我就可以流入流出数据。如果要恢复大量数据,那么HSM软件开始从磁带进行文件预提升(Pre-stage)的速度要比你在家或在办公室在固定机器上接收数据的速度要快很多。最开始的延迟时间为69秒,但是鉴于互联网带宽限制,恢复文件的时间要比从磁带读取数据到HSM磁盘高速缓存的时间要大得多。至少对于我来说,这是"显而易见的做法"。

当然,MAID的延迟要比磁带少很多。MAID的能耗成本也比磁带小很多,但是从每单位比特的角度来看,磁盘驱动器要比磁带贵许多。而且对于MAID来说,还有RAID问题,如果使用RAID 3+1而不是8+2的话,那么浪费在校验盘上的空间比率就更大了。如果你有延迟问题,那么MAID是一个解决办法,但是如果碰到在互联网上恢复大型文件的问题呢?

由于每比特磁盘驱动器成本要比磁带高,而且大型恢复的延迟问题可能被HSM预提升文件所隐藏,那么为什么还要在在线备份中使用磁盘呢?多花一分钟时间来恢复你不小心的删除的Aunt Sandy 60周岁生日中你妈妈的照片,或者坏了的Barry White歌曲,这会有什么影响吗?不说绿色问题,将能源用于这种类型的应用确实值得吗?如果磁带也可以胜任这种任务,为什么还要为能源和磁盘驱动器花更多的钱呢?

除非这种问题是出于技术上的原因,否则我看不到合理性。我经常听到说HSM很难使用,但是从我的经验来看却不是如此。HSM从1970年代就出现,此后被反复尝试和试验。可能问题是其存储技术对于人们来说过于复杂而无法实施HSM。无论障碍是什么,对我来说,我认为这是在线备份提供商应该重新考虑的问题。只要没有其他问题,对于一些企业级在线备份商来说,通过使用成熟的磁带架构能够为他们带来价格上的优势。