技术趋势改变数据未来,弃带从盘备份时代来临

    「过去我没得选择…」。常听到人生怀着这种缺憾,就像是资深管理员所面对的磁带时的无奈心情。


    由于企业每日运营所产生的电子数据相当庞大,为了备份这些数据,不得不选择磁带,因为用硬盘备份将所费不赀。从容量价格比来看,磁带始终优于硬盘,即便用极端的比较,这样的优势都很明显,今日光华商场一颗250GB的ATA硬盘约5,200新台币,而美国HP官方网站上的报价,一个LTO-3的400GB磁带则要127.4美元(汇率以33:1为准,约4,200新台币),何况400GB是原生容量,典型磁带都可以提供2:1的备份压缩率,理想上可有800GB的存储能力。



    接着我们将容量价格比计算一下:


    硬盘:5,200/250=20.8(每GB须花20.8台币购买)
    磁带:4,200/400=10.5(每GB须花10.5台币购买)
    两害相权…难以抉择


    也就是说,企业若执意不用磁带备份而选硬盘,就必须接受备份系统的建置成本多1倍的事实,甚至是多3倍(倘若善用磁带的压缩能力),如果只是一周的备份,由于数据量少,两种建置方案的价差可能还不会太大。但企业通常要备份一个月、一年,甚至数年、十数年、数十年,尤其美国订立了沙宾法案后,会计帐至少要保留4年,而美国医疗业的医疗记录也受法令要求得保存21年,健康保险的要求更是要达30年,有些规定甚至是企业营运结束前都不能消灭数据,如此备份系统的价差就更明显了。


    磁带唯一的优点是便宜,碍于建置成本,企业与管理人员没得选择,但也就必须连带承受相关的折磨与苦难。磁带平常必须在防潮环境中使用、保存,否则发霉就会损害数据;然后磁带不能与强扇区相邻(如电风扇、马达等),否则长时间共处会造成磁化,数据一样消失;再者磁带若长期不使用,久了会造成黏带,数据与带子一同毁坏;或者经常卷动带中的某一段,过频繁的机械拉扯造成带子的松紧差别,使数据存取经常发生错误。


    最后一项痛苦不仅资管员体验过,相信一般人也曾经大大沮丧,那就是「卡」带,无论居家的录放机,还是企业备份用的数据磁带,带子卡住无法退带,甚至带子已经在机内胡乱纠缠,这时才是真正欲哭无泪的时候。


    就算上述的情况都因资管人的细心照料而能防患未然,但磁带过慢的速度也让今日的企业相当头大,银行都积极在加长营业时间,不再是三点半收摊,开始延长至四点、七点,甚至已对例假日营业进行试办,这表示系统的运作时间要增长,相对的备份时间就必须缩短,而全天候的电子商务系统对此更是苛求,然而缓慢的磁带备份加速有限,若在备份过程中有个小闪失,备份时间就必须拉长,加速不成就算,还经常打「延长赛」。


    磁带到底多慢?我们同样以具体数据说明,以LTO-2磁带机而言,其原生速度约30~35MB/Sec,善用压缩存储也有助于加速存取,但最多也只能增1倍效能,达60~70MB/Sec。相对的,今日UltraATA硬盘多有100~133MB/Sec的速度,SerialATA更是有1.5Gbps(约150MB/Sec),很快就要有3Gbps版本出现,况且企业多以数组组态(RAID)方式来运用硬盘,使硬盘备份可以进一步加速,相对的磁带柜(Tape Library)并没有数组加速作法。


    新契机


    不过,情况可能将要改变。随着硬盘的价格节节下跌,容量与速度却节节上升,使得企业开始考虑一种混用组态与作法,即是使用比Fibre Channel硬盘、SCSI硬盘还平价许多的ATA硬盘来构成「中介、过渡」的备份系统:数据备份先送往此系统,之后再送往磁带柜,当数据统统送至ATA硬盘系统时,就可视为备份完成,营运信息系统即可恢复成一般作业状态(通常系统处于备份状态时会停止营运,或至少使营运效能降低),如此备份时间便可大幅缩短。


    更简单说,以往若想调阅已经封存的历史数据,从庞大、缓慢的磁带堆中找寻是相当痛苦且无效率的,通常会将较可能调阅的数据存放在磁光盘柜(MO Jukebox)中以加速调阅。新的中介ATA平价磁盘系统可用以取代光盘柜,作为备份缓冲(Backup Buffer),甚至可成为调阅快取(Cache)。


    这种混态加速作法,现在被业者惯称为D2D2T,即Disk-to-Disk-to-Tape:从On-Line营运系统的硬盘柜(中高价位的SCSI硬盘、Fibre Channel硬盘所组成)将数据复制到Near-Line的中介硬盘柜(平价、低价),再转至Off-Line的磁带柜。


    传统的备份方式是D2T,现在混态加速称为D2D2T,但这是对大型企业而言。对于部门、小组或中小企业等,他们的备份资料量不大,但也有加速备份的需求,而规模小,通常就更要弹性、快速。所以也可能考虑彻底「弃带就碟」,除了营运系统的硬盘柜外,其备份方面只准备中介硬盘柜,而没有更后续的磁带柜,如此便成了D2D组态,可说是多增些花费,但可更快速备份。


    附注:过去Legato(今日为EMC)的备份软件能同时驱动磁带柜内多个读写臂,以平行拆分方式来加速备份数据的写入(类似磁盘阵列系统中的Stripping技术),好让尖峰时段的备份时间缩短,但仍会在离峰时将分散的数据进行集中,因此只有备份(Backup)加快,还原(Restore)时与传统磁带系统效能相同。 


    大企业备份用D2D2T、中小企业备份用D2D,这真的是新的资管趋势吗?笔者不再凭空解说,以下将以多家业者的实际行动来说明。


    首先,EMC有Centera存储系统,用ATA硬盘组成,诉求即在于取代加速历史数据调阅的磁光盘柜,之后也推出了CLARiiON硬盘柜(Disk Library),对此EMC称为Backup-to-Disk Solution。


    接着是StorageTek,该公司更是直接打出「D2D2T」字样,先将数据备份至FlexLine系列的硬盘柜,称为Disk-to-disk backup,之后再写入磁带柜中。


    再者有NetApp,该公司推出NearStore系统,亦是ATA硬盘柜,从字样中的「Near」即可知该存储系统为近线存储(Near-line),充当备份缓冲,甚至是调阅快取的功用。


    磁带业者改弦易辙


    各许读者会说:EMC、NetApp都是纯硬盘方案的业者,另外StorageTek一直同时经营磁带与硬盘系统,所以自然会推倡此种新备份方式,因为新作法对他们而言较为有利,技术也较熟悉、接近。


    但笔者要说的是,这必是不可违逆的新趋势,就连过去的纯磁带方案业者,今日也纷纷提出硬盘备份方案,不再墨守只提供磁带,例如Quantum(注一)就推出DX30、DX100的Disk-Based Backup System,以往Quantum便将硬盘业务全数交给Maxtor,自身专心于磁带业务,而DX30/100证明Quantum除原有的磁带备份方案,也开始提供硬盘备份方案。


    或许各位还有所疑,虽然Quantum不再经营硬盘,但曾经仍保持以硬盘为基础的应用系统不是吗?(例如NAS存储设备)如果这样还不足以信服,那么自Seagate磁带部门独立出的Certance或许更有说服力。Certance原本是100%磁带备份方案的业者,之后也推出使用ATA硬盘的CP 3100系统,Certance更是明言此是D2D2T方案。相较于多数业者都只对大型企业推动D2D2T方案,Certance则是向中小企业推行D2D2T方案,截至目前Certance都还是中小企业市场中最成功的D2D2T方案业者。


    Certance是较为中小型方案的磁带业者,大型磁带系统的业者必然会坚守纯用磁带备份的技术立场又如何?ADIC如今也有Disk-Based Backup方案,称为Pathlight VX系列;Overland也相同,并写明同时提供D2D或D2D2T两种选择,Overland的硬盘备份系统称为REO,目前有1000、4000、9000等三型。其它如Qualstar等也有,不胜枚举。过去100%经营大型磁带备份系统的业者,如今几乎都提供以硬盘加速备份的方案,或在中小规模的备份上可完全舍弃磁带。


    软件业者跳上乐队花车


    存储硬件业者如此,软件业者又怎么看?答案也是肯定的,Veritas(注二)表示新版的备份软件都支持Backup Cache/Buffer的作法。


    即便企业不愿花钱让备份软件升级,现有的备份软件也有机会实现D2D2T与D2D,StorageTek、Quantum、MaXXan等业者都在自家的中介硬盘柜上加入「Virtual Tape System,虚拟磁带系统」机制,透过此机制,既有的备份软件会以为中介硬盘柜是磁带柜,而照常平顺地将数据复制到中介区内,而Quantum更是加入硬件压缩机制,让硬盘存储也跟磁带一样,透过压缩获得备份空间精省的效果。


    所以,这是否意谓着,未来就只有D2D及D2D2T,传统的D2T将消失不见?倒也未必,在企业级磁带业务上的最大市占者:HP,就认为磁带系统在效能上也不断精进,以往由于磁带过慢而被人贴上Off-Line的角色标签,但新标准的LTO-3磁带机的原生效能已至80MB/Sec,加上压缩机制的加速最高可达160MB/Sec,已有不输给ATA硬盘的速度,所以HP主张高速的磁带系统已具备Near-Line的资格能耐,企业使用高速磁带系统,依然可以保持过去D2T的简单、直接组态。(注三)


    类似的,StorageTek向来也以卓越的磁带系统闻名,虽然力倡D2D2T方案,但也不认为磁带永远慢速与离线运用,事实上其D2D2T的缩词中,其T(磁带)指的是Near-Line存储系统,而最前面的D(硬盘)字样指的是On-Line存储系统,至于中介的D则被该公司赋予新称呼:In-Line存储,其它业者没有此种称法,但很明显的也是不希望贬低磁带的价值,虽然StorageTek同时具有磁带与硬盘业务,但一提及StorageTek多数人必先想到磁带,硬盘系统反居次。


    列举至此,相信诸位已能体会新备份的主义时代已然到来。在Internet全天候营运的影响日益遍深下,信息系统的可用性(Availability)将会被更严苛要求,停机(Downtime)时间愈短愈好,特别是备份工作为例行性系统影响,如何更快备份,或在备份时让系统效能减损降至最低,备份流程与组态实有必要再次检视与审思,至少贵公司有机会摆脱或降低对磁带的依赖。


    注一:2004年10月Quantum敲定收并Certance,并预定于今年正式完成。
    注二:VERITAS已被赛门铁克并购。
    注三:IBM的3592磁带机,原生速度有40MB/Sec,但因压缩率最高可至3:1,因此理想最高速度可至120MB/Sec,亦有不输ATA硬盘的效能,但IBM方面较少谈及磁带系统高速化后的角色定位。


    本文作者为CNet Asia专栏作家。