存储将相和:用磁盘备份 用磁带归档解决方案

    据美国德州大学的一项调查显示,如果遇到灾难性的数据损失,54%的美国公司会倒闭,只有6%的企业能够在灾难后继续存活。由此可见数据备份的重要性和迫切性。


    备份与归档


    在日常工作中,大多数人都有数据保护的意识,比如把重要的数据进行复制。但是复制只是对单时间点的数据进行拷贝,不能保存数据的历史。


    数据存储通常可分成在线存储和离线存储两大类。一般意义上的在线存储,目的是保存应用程序,如数据库产生的数据。在线存储要求高速、小容量以及随机读取能力,通常情况下对大容量数据的写入速度要求并不高,存储介质为SCSI盘阵或光纤盘阵,价格比较昂贵。离线存储的目的是保存在线存储的副本。它通常强调大容量数据的写入速度,而且要求介质的价格比较低。


    数据的分级存储


    由于数据量的增加,以及应用的细分,人们开始考虑如何才能更有效地存储数据,并不断降低成本,于是,分级存储管理、信息生命周期管理等概念的出现,也引出了近线存储。近线存储本质上仍属于在线存储的范畴,只不过存储的是在线数据中使用频率较低的那部分数据。


    数据的分级存储就是按照数据所处不同阶段的重要性和使用频率的差异,将它们存储在最适宜的存储设备中,从而实现最有效的管理和最低的成本。比如,在线数据通常存储在价格较高、可靠性较高的SCSI盘阵或光纤盘阵中,近线数据通常存储在价格相对便宜的SATA盘阵中,而离线数据则保存在磁带设备中。


    离线存储


    以前,由于磁盘的价格远远高于磁带,所以考虑到数据的长期保存以及成本等问题,离线的数据通常都存放在磁带设备上。其实,如果再细分下去,离线存储还可以分为备份和归档两种应用。备份主要是保存近期日常数据的副本,以便在灾难发生后进行恢复。备份的保存期相对较短,但要求具备自动恢复和管理的能力。归档是指保存阶段性总结,以便中长期备份或容灾,也可用于异地恢复,通常没有自动恢复的要求。备份的目的是为了恢复,而归档主要是数据的长期保存。由于磁盘的价格逐渐降低,用磁盘作为备份的介质已经成为可能。从介质的角度看,备份与归档两种应用可以被更严格地区分开。


    磁盘与磁带


    北京双戈科技有限公司总经理钱海鹏博士分析认为,备份与归档的目的不同,因此导致它们对介质的核心性能要求也不相同。备份介质要求快速写入以及介质的高可用性,如反复擦写,而归档介质主要考虑保证长时间的数据存储,以及便于携带。据此,ATA/SATA磁盘更适用于备份,而磁带更适用于归档。


    市场差异


    从目前中国存储市场的现状看,大多数用户仍是使用磁带承担备份和归档的双重任务,究其原因,是因为磁带远比磁盘价廉。但据统计,ATA磁盘的成本正逐渐接近甚至低于磁带,而从美国市场的情况看,磁盘有取代磁带成为备份主流介质的趋势。


    从磁盘和磁带设备本身的特点来看,磁盘的可靠性更高、速度更快,这对于数据恢复是有利的;而磁带库是各种机械设备的组合,机械故障在所难免,而且磁带介质缺少有效的容错设计,这对于数据的恢复是不利的。



软件虚拟磁带库逻辑地将磁盘模拟为磁带



纯硬件虚拟磁带库物理地实现磁盘线性化


    磁盘与磁带备份相互补充


    由于越来越多的人开始用磁盘作备份,有些人便预测磁盘会完全替代磁带。其实,磁盘备份的应用只是让备份和归档的界线更明确,磁盘和磁带各有适用的范围,两者并不会完全替代,而是相互补充。


    虚拟磁带库


    实现磁盘备份的产品有很多,我们这里主要介绍虚拟磁带库。


    从用户端(备份服务器/网络端)看,虚拟磁带库与传统的磁带库无异,只是使用磁盘阵列作为存储介质而非磁带。从备份的角度看,虚拟磁带库与传统磁带库相比,一方面是备份和恢复的速度提高了,另一方面维护更容易,可靠性进一步提高。


    其实,早在10多年前,IBM、StorageTek公司就已经采用了虚拟磁带库这一概念,但因为种种原因,仅是作为传统磁带库的缓存设备,或者必须依附于特定的主机系统,不能灵活应用,因此导致市场认知度低。


    Mirage虚拟磁带库


    北京双戈科技有限公司推出的Mirage虚拟磁带库是一个纯硬件的设备,没有CPU和相关的操作系统。Mirage虚拟磁带库将后接的磁盘阵列视为无格式的裸介质,并以与磁带书写完全相同的字节到字节(byte-to-byte)的方式向磁盘写入数据,因此成倍地提高了数据的传输速度,并提高了空间利用率。Mirage虚拟磁带库后接盘阵中的备份数据不能被任何主机/网络直接识别或访问,这就造成了“形似在线,实则离线”的效果,因此保证了备份的可靠性,并可以抵抗病毒的侵袭。采用Mirage虚拟磁带库,不用改变原有的备份策略和流程,原有的备份软件也可正常使用。


    虚拟磁带库可以承担起传统磁带库的备份功能,而不是仅仅作为备份的缓存设备。用户还可以根据需要,将虚拟磁带库中的数据倒入到传统磁带库中实现数据的归档。