1 数据丢失的原因及数据备份
随着计算机和网络在图书馆应用的日益普及,图书馆和读者都在不停地创建和使用着各种信息。社会对于信息系统的依赖性,以及信息系统在人为攻击和自然灾害面前的脆弱性,日益引起图书馆和学校的重视。然而,由于对保护这些信息缺乏相应的理解,于是造成了由于系统功能不正常、人为错误、计算机病毒和其他不可预测的因素所带来的系统间断、数据丢失等等灾难性事故。
1.1 数据丢失的原因
数据丢失来自以下原因:一是自然灾害,包括地震、火灾、雷电、洪水、飓风;二是犯罪,包括盗窃,故意破坏,制造病毒;三是软硬件故障,如硬盘划伤;四是人为因素,如误操作,误删除。硬件故障、软件错误、人的误操作是数据丢失的最主要原因。50 %以上的数据丢失是由于硬件故障或软件错误造成的;30 %以上的数据丢失是由人的错误操作造成的;病毒和自然灾害造成的数据丢失不到15 %。
1.2 数据备份
数据备份是一种数据安全策略,是将原始数据完全一样地复制,严格来说应复制两份,保存在异地。在原始数据丢失或遭到破坏的情况下,利用备份数据把原始数据恢复出来,使系统能够正常工作。建立完整的网络数据备份系统必须考虑以下内容:
(1)图书馆计算机网络数据备份的自动化,以减少系统管理员的工作量;
(2)使图书馆数据备份工作制度化/科学化;
(3)对介质管理的有效化,防止读写操作的错误;
(4)对图书馆数据形成分门别类的介质存储,使数据的保存更细致、科学;
(5)自动介质的清洗轮转,提高介质的安全性和使用寿命;
(6)对各种平台的应用系统及其他信息数据进行集中备份,系统管理员可以在任意一台工作站上管理、监控、配置备份系统,实现分布处理,集中管理的特点;
(7)维护人员可以容易地恢复损坏的整个文件系统和各类数据;
(8)备份系统还应考虑网络带宽对备份性能的影响,备份服务器的平台选择及安全性,备份系统容量的适度冗余,备份系统良好的扩展性等因素。
2 数据备份方案设计
图书馆数据备份分典型数据备份及容灾系统(见图l )和现阶段常用数据备份,即双工热备。这里主要介绍图书馆典型数据备份及容灾系统。
该方案可以实现局域网内或异地(要求有足够的网络带宽)的网络数据备份。备份服务器上安装备份软件主模块,将数据集中备份到本地磁带机或其他备份设备上;其他服务器上安装相应的代理程序(Agent),实现对相应数据的备份。
2.1 备份硬件的选择
硬件是备份系统的重要组成部分,对于整个备份系统的性能、可靠性有着举足轻重的作用。在选择备份硬件时,应考虑备份速度、备份介质费用、备份数据的易保管性、备份硬件的可维护性等。
通过对常用备份介质(硬盘,MO,CD-R,CD-RW,磁带等)的充分比较,我们决定采用磁带备份。磁带备份有以下好处:其一,磁带是数据备份首选的介质。磁带备份技术是最成熟、可靠的保全数据的方法,是经过反复验证和考验的技术,而且磁带技术一直在迅猛发展,不断满足对数据备份的新的要求。磁带是最便宜的数据存储介质,磁带是可移动的存储介质,其容量是无限的,只是与所使用的磁带数量有关,同时磁带可以脱机保存,确保了数据的安全性。其二,数据存储的自动化。对拥有大量重要数据而且这些数据又在不断增长的用户来说,近几年自动加载磁带机或磁带库越来越多地成为他们的选择。
目前市场上的磁带机和磁带库的种类很多,比较好的品牌是HP,Exabyte和Tandberg磁带机、磁带库。
2.2 备份软件的选择
好的备份硬件是完成备份任务的基础,而备份软件则关系到是否能够将备份硬件的优良特性完全发挥出来,同时满足用户的备份需求。在备份软件选择上应考虑以下几点:软件质量保证程度、软件对系统性能的影响、软件的可扩充性、软件的运行费用。
国外对网络备份系统的研究和开发,始于20世纪80年代中期。到目前为止,成熟的产品有:VERITAS公司的Backup Exec,CA(Computer Associates)公司的ARCServe 等软件。建议的备份策略为:
(1)制定自动循环作业。每星期一天(如星期日),对数据库或Lotus Notes Server等要备份的对象进行完全备份(Full Backup)。
(2)制定自动循环作业。每星期的其他天(如星期一至星期六),每天对要备份的对象进行差别备份(Differential Backup)。
(3)在首次安装完软件后,制作一套灾难恢复的紧急启动盘,同时对所有要备份的服务器分别做一次手动的系统完全备份。
(4)每当服务器的系统有了比较大的变化,如安装了新的应用程序或新的系统配置后,应该对服务器进行一次系统完全备份。
3 日常维护的有关问题
备份系统安装调试成功结束后,日常维护包含两方面工作,即硬件维护和软件维护。如果硬件设备具有很好的可靠性,系统正常运行后基本不需要经常维护。一般来说,硬件的易损部件是磁带驱动器,当出现备份读写错误时应首先检查驱动器的工作状态。如果发生意外断电等情况,系统重新启动运行后,应检查设备与软件的连接是否正常。一般1个月清洗一次磁头。软件系统工作过程检测到的软硬件错误和警告信息都有明显的提示和日志,可以通过电子邮件发送给管理员。管理员也可以利用远程管理的功能,全面监控备份系统的运行情况。
为了使日常维护工作更方便,事先要计算出无人干涉的时间(即两次手工换带之间的间隔时间),这个时间和磁带容量有关系,同时和以下几个因素相关:网络中的总数据量,Ql;数据备份时间表(即增量备份的天数),假设用户周一至周四作一个增量备份,周五作一个全备份,D=4 d;每日数据改变量,Q2;期望无人干涉的时间,假定为m个月;数据增长量的估计,假定每月以20%递增,i=20%;考虑坏带,不可预见因素,一般为30%,假定u=30%;以上各因素和备份设备容量的关系为:
C=[(Q1+Q2×D)×4×m×(l+I)]×(l+u)
从磁带的总容量就可以推算出无人干涉的时间m。
4 灾难恢复方法
4.1 数据恢复
当出现数据丢失时,就可以通过备份软件来恢复数据。
第一步:找到相应数据的最近一次完全备份和最近一次差别备份的磁带。
第二步:运行恢复向导,按提示先放入最近一次完全备份的磁带,进行数据恢复。
第三步:然后按软件提示放入最近一次差别备份的磁带,进行数据恢复。这样就可以将数据恢复到最近一次备份时的状态。
4.2 系统恢复
当出现服务器硬件或软件损坏导致系统崩溃后,可以利用Disaster Recovery (灾难恢复模块)进行灾难恢复。主要步骤为:
第一步:更换失效的硬件;
第二步:由灾难恢复紧急启动软盘进入灾难恢复引导模板;
第三步:根据引导模板按步骤重新配置硬盘,创建和格式化分区,恢复网络操作系统和重要的配置信息,恢复备份软件。然后备份软件启动恢复最后的完全数据备份,使宕机的服务器在数小时内恢复完全可用的状态。
此外,灾难恢复模块具有支持跨网络进行远端灾难恢复的能力,只要该台工作站的硬盘能够连上网络,而该网络上具有备份服务器,便能够用几片灾难恢复紧急启动磁盘,通过网络对没有安装磁带机及备份软件的工作站或软件进行灾难恢复重建的工作,避免了必须将磁带装置移至本地机器的困扰。
整个系统恢复过程,无须手工安装系统、安装应用程序和进行系统配置等,只需按引导模板提供Windows NT 安装盘及备份磁带。