磁带与磁碟之争:“弃带就碟”备份时代来临(一)

    “过去我没得选择…”。常听到人生怀着这种缺憾,就像是IT人员所面对的磁带时的无奈心情。


    由于企业每日营运所产生的电子数据相当庞大,为了备份这些数据,不得不选择磁带,因为用硬盘备份将所费不赀。从容量价格比来看,磁带始终优于硬盘,即便用极端的比较,这样的优势都很明显,今日市场上一块250GB的ATA硬盘约1千多元,而美国HP官方网站上的报价,一个LTO-3的400GB磁带则要127.4美元,何况400GB是原生容量,典型磁带都可以提供2:1的备份压缩率,理想上可有800GB的储存能力。 
  
    两害相权…难以抉择 
  
    也就是说,企业若执意不用磁带备份而选硬盘,就必须接受备份系统的建置成本多1倍的事实,甚至是多3倍(倘若善用磁带的压缩能力),如果只是一周的备份,由于数据量少,两种建置方案的价差可能还不会太大。但企业通常要备份一个月、一年,甚至数年、十数年、数十年,尤其美国订立了萨宾法案后,会计帐至少要保留4年,而美国医疗业的医疗记录也受法令要求得保存21年,健康保险的要求更是要达30年,有些规定甚至是企业营运结束前都不能消灭数据,如此备份系统的价差就更明显了。 
  
    磁带唯一的优点是便宜,碍于建置成本,企业与管理人员没得选择,但也就必须连带承受相关的折磨与苦难。磁带平常必须在防潮环境中使用、保存,否则发霉就会损害数据;然后磁带不能与强扇区相邻(如电风扇、马达等),否则长时间共处会造成磁化,数据一样消失;再者磁带若长期不使用,久了会造成黏带,数据与带子一同毁坏;或者经常卷动带中的某一段,过频繁的机械拉扯造成带子的松紧差别,使数据存取经常发生错误。
   
    最后一项痛苦不仅IT人员体验过,相信一般人也曾经大大沮丧,那就是”卡”带,无论居家的录放机,还是企业备份用的数据磁带,带子卡住无法退带,甚至带子已经在机内胡乱纠缠,这时才是真正欲哭无泪的时候。 
  
    就算上述的情况都因IT人的细心照料而能防患未然,但磁带过慢的速度也让今日的企业相当头大,银行都积极在加长营业时间,不再是三点半收摊,开始延长至四点、七点,甚至已对例假日营业进行试办,这表示系统的运作时间要增长,相对的备份时间就必须缩短,而全天候的电子商务系统对此更是苛求,然而缓慢的磁带备份加速有限,若在备份过程中有个小闪失,备份时间就必须拉长,加速不成就算,还经常打“加时赛”。 
  
    磁带到底多慢?我们同样以具体数据说明,以LTO-2磁带机而言,其原生速度约30~35MB/Sec,善用压缩储存也有助于加速存取,但最多也只能增1倍效能,达60~70MB/Sec。相对的,今日UltraATA硬盘多有100~133MB/Sec的速度,SerialATA更是有1.5Gbps(约150MB/Sec),很快就要有3Gbps版本出现,况且企业多以RAID方式来运用硬盘,使硬盘备份可以进一步加速,相对的磁带柜(Tape Library)并没有数组加速作法。 
  
    新契机 
  
    不过,情况可能将要改变。随着硬盘的价格节节下跌,容量与速度却节节上升,使得企业开始考虑一种混用组态与作法,即是使用比Fibre Channel硬盘、SCSI硬盘还平价许多的ATA硬盘来构成“中介、过渡”的备份系统:数据备份先送往此系统,之后再送往磁带柜,当数据统统送至ATA硬盘系统时,就可视为备份完成,营运信息系统即可恢复成一般作业状态(通常系统处于备份状态时会停止营运,或至少使营运效能降低),如此备份时间便可大幅缩短。 
  
    更简单说,以往若想调阅已经封存的历史数据,从庞大、缓慢的磁带堆中找寻是相当痛苦且无效率的,通常会将较可能调阅的数据存放在磁光盘柜(MO Jukebox)中以加速调阅。新的中介ATA平价磁盘系统可用以取代光盘柜,作为备份缓冲(Backup Buffer),甚至可成为调阅快取(Cache)。 
  
    这种混态加速作法,现在被业者惯称为D2D2T,即Disk-to-Disk-to-Tape:从On-Line营运系统的硬盘柜(中高价位的SCSI硬盘、Fibre Channel硬盘所组成)将数据复制到Near-Line的中端硬盘柜(平价、低价),再转至Off-Line的磁带柜。 
  
    传统的备份方式是D2T,现在混态加速称为D2D2T,但这是对大型企业而言。对于部门、小组或中小企业等,他们的备份资料量不大,但也有加速备份的需求,而规模小,通常就更要弹性、快速。所以也可能考虑彻底”弃带就碟”,除了营运系统的硬盘柜外,其备份方面只准备中介硬盘柜,而没有更后续的磁带柜,如此便成了D2D组态,可说是多增些花费,但可更快速备份。 
  
    附注:过去Legato(今日为EMC)的备份软件能同时驱动磁带柜内多个读写臂,以平行拆分方式来加速备份数据的写入(类似磁盘阵列系统中的Stripping技术),好让尖峰时段的备份时间缩短,但仍会在离峰时将分散的数据进行集中,因此只有备份(Backup)加快,还原(Restore)时与传统磁带系统效能相同。(未完待序)