备份基础知识:文件、数据库和操作系统的保护

 

我们知道企业级备份软件或者备份一体机支持对文件、数据库和操作系统的保护功能,那么对于文件、数据库和操作系统的保护在技术实现上有哪些差别呢?本文将对文件、数据库和操作系统的保护这些备份基础知识进行介绍,希望能够帮助读者多了解一些备份相关知识。

文件:完全、增量和差异备份

对普通文件的备份,企业级的传统定时备份技术通常会将数据打包成某种格式存放。类似把生产存储上选定的文件、文件夹/目录结构复制到备份介质存储。

对于文件备份,目前几乎绝大多数的备份软件,除了完全备份之外,都能支持增量备份和差异备份(或称差分备份)。所谓增量备份,就是在上一次全备份或者增量备份的基础上,扫描数据源端新增/改变/删除的对象,并对这些变化数据进行备份;恢复时也是按照全备份——增量备份的顺序来进行。而差异备份,则每次都是以上一个全备份为基础进行比对,会占用更多地空间,但恢复时也减少了按顺序依次恢复增量备份的繁琐。

数据库:如何实现备份数据的一致性

数据库备份就没这么简单了。首先,需要保证控制文件、数据文件和日志在时间上的一致性。一般的数据库在设计时为了提高存储的性能,不一定是每条记录的写入操作都会立即保存到硬盘上,比如Oracle默认就是每隔3秒刷新写缓存中的数据到磁盘。如果在这期间出现断电等异常情况,则靠日志来恢复事务的完整性。那我们在备份时,肯定希望是在数据文件和日志文件完全一致的情况,也就是Flush动作刚执行完的状态,此时可以保证数据库的正常可用。数据库备份代理的一个重要功能就是在执行备份前通知数据库将内存中的“脏数据”写盘。

大多数情况下,备份软件是通过调用数据库自身的API或者命令来实现这一点的。以火星高科的MBA(火星舱上的备份功能也是用的这款软件)为例,对Oracle数据库备份支持调用RMAN和导入/导出(import/export)两种方式。RMAN是Oracle自身的备份/恢复程序,支持基于归档日志的增量备份,易用性较好;导入/导出方式相对更加灵活,支持单表操作,但不支持增量备份,操作也相对复杂。对于高级用户,还提供了备份前脚本和备份后脚本的支持。

操作系统:启动相关数据和恢复引导介质

对于操作系统备份,并不是简单地把文件都拷贝一份那么简单,用过ghost等磁盘克隆软件的用户都应该理解。首先,对打开文件的访问支持是个基础条件——有些被OS占用的系统文件需要备份;另外,还有MBR主引导记录/启动扇区,或者GPT格式的启动分区(就像我们安装Windows Server 2008/Windows 7时自动创建的100MB分区),Linux通常也建议有一个100MB左右的boot分区,这些都需要被正常的备份和恢复才能保证操作系统的启动。

企业级备份与普通桌面备份在恢复时的重要一点区别是:桌面备份有些是从本地硬盘、移动硬盘或者光盘来恢复;而企业备份都是要通过网络访问备份服务器、备份一体机乃至FC光纤/SAS连接的磁带(包括虚拟磁带库)设备来恢复数据。因此后者需要一个专用的引导介质,它们可能是基于WinPE和Linux的LiveCD定制的程序。即使是裸机恢复,到一个空白的硬盘,甚至是在另一台服务器上也能正常进行(异机恢复)。

综合来说,数据备份的可靠性不依赖于生产存储和被保护服务器的正常运行,也就是在需要的时候可以做异机恢复。对于火星舱数据保护系统来说,除了传统的定时备份之外,通过CDP(持续数据保护)和SAN Boot技术还能够实时备份、更加快捷地恢复操作系统运行。