董唯元存储专栏 备份系统硬件介绍

前言

在信息系统的安全保护措施中,数据备份是最基础也是最重要的手段。备份系统是通过硬件设备和相应的管理软件共同实现的。本文将向读者介绍备份系统的硬件部分,希望对用户选择驱动技术和硬件备份产品有所帮助。

    硬件备份产品的介质包括磁介质和光介质2种,由于企业信息系统最常用的备份介质是磁介质,因此我们将更多的注意力Focus在它身上。

备份设备类型

在选择备份设备时,根据用户需要备份数据量的大小、对备份速度的要求、对自动化程度的要求等,我们可以选择不同档次的设备。备份设备是多种多样的,主要分为磁带机、自动加载机、磁带库;而磁带库又分为入门级、企业级和超大容量等几个级别。

    磁带机(又称磁带驱动器,简称带机),是读写磁带的基本设备。它通过SCSI线缆与服务器直连,相当于服务器的外设,分为内置和外置2种。一台带机一次只能容纳一盘磁带,需要人工换带,自动化程度低。一般只用于单台服务器备份,适合于数据量非常小的企业。

    如果企业希望通过预先制定的备份策略,实现备份过程和备份介质的自动化管理,减少系统管理的工作量,则需要购买能够容纳多盘磁带的设备,即自动加载机或带库。

    自动加载机内一般能够容纳4~20盘磁带。它与带库的主要区别在于不是通过机械手抓取磁带,而是通过一个简单的自动传送装置移动磁带,并且只能配一台磁带驱动器。因此实现成本较低,但功能也受到限制。它虽然能够支持自动备份,但仍然属于低端的备份设备,适合于单台服务器或小型网络。

     磁带库(常简称为带库)是专业的备份设备,它主要由库体、磁带驱动器、磁带槽位、磁带交换口、控制面板、机械手和电子控制单元组成。库体内的大部分空间用于放置磁带,一台或多台驱动器安装在库体内专门的位置,用于读写磁带。带库工作时,机械手在管理软件和电子控制单元的控制下移动,通过安装在机械臂上的条码读取器寻找相应的磁带,然后将其抓取到驱动器内;读或写操作完成后,再由机械手将磁带取出,放回磁带槽位。

    由于带库内可安装多个驱动器,因此能够支持并发的多任务;对于一个大的备份任务,也可以分配到多个驱动器上并行读/写,从而大大提高备份效率,有效地缩小备份窗口。当然这些功能需要备份管理软件的支持。

    一般具有几十个磁带槽位的带库属于入门级,几百个槽位的属于企业级,几千个槽位的则属于超大容量带库。企业级以上的带库还支持一些复杂的功能,如分区管理、磁带混装和级联扩展等。另外,随着SAN技术和LAN-free备份方式的推广,越来越多的企业将带库连接到SAN上作为共享的存储资源。因此带库厂商也非常重视带库对SAN的支持,很多企业级带库不仅提供光纤通道接口,还增加了SAN环境下的管理功能。

驱动技术简介

为了帮助读者更好地了解带库,我们有必要先介绍一些磁带驱动技术方面的知识。

    磁带驱动技术是指磁带驱动器遵循的标准,它规定了数据格式、记录方式、定位方式、走带路径、校验方式、压缩算法、介质尺寸、介质生产工艺以及驱动器的接口标准等等。在驱动器和磁带的生产过程中,都必须遵从某一种驱动技术的标准。只有采用相同标准生产出来的驱动器和磁带才能一起工作。

    每个磁带驱动器都对应着某个特定的磁带驱动技术,例如Sony AIT磁带机采用的就是AIT技术,而Quantum的DLT磁带机采用的是DLT技术。但是磁带库本身与磁记录技术则没有任何必然的联系,也就是说一台带库可以支持多种不同的磁带驱动器,甚至可以支持混装。带库能够支持多少种驱动技术,反应了它的开放性。一般来说,企业信息系统都非常注重开放性,防止在系统扩展时受到某种技术和产品的限制。但是在一些特殊领域,则可能由于行业特点或行业习惯一直沿用某种产品,而不是非常重视开放性。

    目前主流的磁带驱动技术包括Quantum公司的DLT和SuperDLT,IBM、HP和Seagate共同制定的LTO,STK的9840、9940,IBM的3590,Exabyte的Mammoth-2,Sony的AIT-2、AIT-3、DTF、DTF-2等。

    了解一种磁带驱动技术最主要的指标是数据传输率和单盘容量,因为这直接关系到做一次备份所需的时间和介质数量。查看这2个指标时要注意区分厂家给出的数值是未压缩模式下的还是在2:1或更高压缩比下的;另外还要注意区分峰值数据传输率和持续数据传输率的不同,峰值传输率是指瞬间可达的最大传输率,它不能反映带机的整体性能,我们真正应该关心的是持续传输率。反映带机性能的另一个指标是载入时间,是指将一盘磁带插入带机、至带机准备好、再到可进行读写操作所需的时间,一般为几秒到几十秒。相对于备份任务所需的全部时间,载入时间是非常微不足道的。但当带库用于数据迁移(Storage Migration)系统时,由于需要频繁交换磁带,带机的载入时间长短就显得比较重要了。

    除了容量和性能外,一般用户比较关心的要算可靠性了,特别对那些需要带机高负荷工作的系统,可靠性就更为重要。衡量可靠性的一个最常用指标是MTBF(平均无故障时间),它是指带机在出现故障之前平均的正常工作时间。这一指标并不是通过实测得到的,而是综合了影响带机运作的各种因素,以一定的公式计算得出。目前主流的驱动技术其MTBF都可达到十几万到几十万小时。带机内部的稳定性,与磁头设计、走带路径造成的张力和磨损等因素有关,有兴趣的读者可通过研究带机内部的结构、工作方式、校验方式等,更深入地了解和比较各种磁带驱动器的优劣。

    表1简单对比了几种主流磁带驱动技术,供大家参考。


表1 主流磁带驱动技术指标

带机、带库厂商及产品

备份设备的生产厂家很多,每个厂家都有着较长的产品线,由于篇幅所限,我们不可能一一列举。这里主要介绍那些国际知名的、国内有影响力的带机和带库原厂商及其主打产品。

    目前,带机正在朝快的数据传输速度和高的单盘磁带存储容量方向发展,具有主流驱动技术的带机厂商包括Quantum、Exabyte和Sony等。

    Quantum带机在中档产品中占据了市场大部分份额,但其中很大一部分走了OEM的销售渠道。其自动加载机SuperLoader可将多个备份目标集中到一个共享的自动系统中,降低处理成本,而基于磁盘(备份介质是磁盘)又具有磁带海量特性的近线备份设备DX30可显著缩短备份与恢复时间。

    Exabyte的磁带驱动技术包括8mm Mammoth和VXA技术,VXA是定位低端的新的磁带技术,它以包的格式读写数据,并可对磁带上的数据记录区进行无空隙扫描,具有高质量、高可靠性、低成本等性能特点。其中VXA-1带机专为苹果机设计的存储方案;VXA-2同样具有较高的性价比,并具有12MB/s传输速率及160GB容量,与VXA-1向下兼容。

    这里我们有必要讲一讲Sony的基于AIT技术的带机产品:AIT-1、AIT-2和AIT-3,其中AIT-3是高性能和大容量的新存储方案,容量(未压缩)为100GB,速率为12MB/s,而且能够与AIT-1、AIT-2完全读和写逆向兼容,并具有分层磁头、创新性的磁带内存储器(MIC) 驱动器接口系统等多项专利技术,提高磁轨密度和存储速度。

    磁带库厂商相对品牌较多,用户的选择空间也更大一些。目前主流的磁带库厂商主要有STK,Quantum,Exabyte和IBM等。

    在带库厂商中,市场份额最大的当属美国存储技术公司(StorageTek,STK)。STK目前最主要的产品线是L系列,包括L20、L40、L80、L180、L700、L5500,从最小20磁带槽位到最大5500磁带槽位。在其入门级产品上,支持LTO、DLT和SuperDLT等开放技术,只有在高端产品上才同时支持其自身拥有的9840、9940驱动技术。

    Quantum拥有DLT、SuperDLT技术,其用户基础和发展前景都很好。其P系列的主打产品P4000和P7000分别可以支持几百槽位和十几个驱动器,适合于企业级用户;M系列是模块化的产品,可根据用户系统需求的增长灵活扩展带库的容量和性能,M1500可从20槽位扩展到200槽位,M2500则可从100槽位扩展到300槽位,非常适合于那些快速发展的中小企业。美中不足的是,ATL对超大容量的解决方案不是非常理想,在这一部分市场上的竞争力较弱。

    8mm是安百特(Exabyte)公司的独立技术,具有速度快、容量大、可靠性高、价廉、体积小等特点,主要用于带库,其8mm带库的智能机械臂系统可任意存取磁带,采用模块化设计,产品线全,从VXA自动化/驱动器产品系列AutoPak230/115/110、VXA-1/1到Mammoth Tape自动化/驱动器产品系列X200/80/430M/215M/EZ17、M2/Mammoth/Eliant 820,容量从单盘(非压缩)33GB到整库12TB,涵盖由低到高的用户市场,可实现无人值守自动数据存储管理,适用于服务器备份、网络备份、自动归档、分级存储管理及图形图像等领域。

    IBM,众所周知,生产和销售所有IT类产品,当然也包括带库产品。IBM的带库和带机产品大体可分2个系列:用于IBM环境的和用于开放环境的。如IBM的3494、3575等带库只支持其专用的驱动器,开放性差,虽然这些带库产品也支持HP、SUN等主流服务器平台,但实际上几乎只用在IBM环境中。随着SAN技术的普及,追求开放性和互联性成为存储行业的潮流。结合LTO驱动技术的投产,IBM为其开放存储系统解决方案推出了新的带库系列??3583和3584。表2列出了上述带库生产厂家部分产品的参数。


表2 主流带库产品参数表

产品选购指南

了解了带库和驱动技术这些背景知识后,当我们真的建设备份系统、购买备份设备时,需要考虑和考查哪些问题呢?

    首先,要选择符合应用特点的驱动技术。前面已经讲过比较驱动技术时主要考虑哪些方面,但事实上每种技术都有它的特点和优点,不是能够通过简单的参数对比就能比出高下的。真正需要采购时还是要结合实际需求,根据应用特点确定驱动技术的哪一项或哪几项指标比较重要。例如,对于备份和归档的数据量非常大的应用系统而言,选用单盘容量大的磁带驱动技术,从长远角度看是可以有效降低介质成本和管理成本的;而对于需要时常访问归档数据的信息系统,则应注重驱动器的载入时间和读写速度,从而有效降低用户的等待时间。另外在考虑驱动技术自身特性的同时,要考虑其成熟性和发展性。

    选定驱动技术之后,就可以根据需要备份的数据量、信息系统对备份窗口的要求以及采用何种备份策略等因素,确定所需带库的容量和备份速度,从而基本确定可供选择产品的范围。从备选产品中进行第二轮筛选,则要具体分析每个产品的功能和特点,看它是否具备某项您需要的功能,是否有某项缺点恰好影响您的使用。例如,某大型企业网上运行着多个应用系统,希望做集中的数据存储和数据备份,由于应用和数据类型的多样化,可能需要采用不同的磁带格式进行备份,这时带库的分区管理功能和对混合介质的管理功能就是必不可少的。

    筛选过后留下的产品基本都能满足需要,这时当然取决于性价比了。不过别急,在最后选定一款产品前,一定记得请厂家或代理商核查兼容性列表,特别是您的信息系统环境比较复杂时,要确认该产品与原有的、以及计划增加的设备及软件的兼容性。这个环节非常重要,因为带库不是独立工作的,而是与备份服务器、备份客户端、备份管理软件共同组成备份系统。如果忽视了这个环节,可能会给系统实施带来严重的问题.

    还要提醒读者的是,在带库的选择过程中,不要忘记考虑未来的扩展需求。信息系统是不断发展的,基础设施的建设也不可能一步到位。如果在设计初期考虑到带库的扩容能力和功能的多样性,就可以从容面对信息系统需求的发展和变化。