浅析数据归档在云存储环境下的实用性

当第一次考虑使用云服务进行数据归档时,我承认我对采用这种方法是否明智和其实用性持怀疑态度。但云服务确实给IT企业提供了许多便利。但是,每种类型的数据存储需求,包括主数据、备份、灾难恢复、数据归档,都有很大不同。这就意味着,在你选择云服务进行数据归档或存储之前,一定要确保你所选择的服务适合你的数据保护需求。

当然,所需的保护方式取决于你存储数据的类型。在云端存储的数据类型包括:

数据备份,用于系统崩溃后的数据恢复;

灾难恢复,用以自然灾害或意外断电后的数据保护和维护业务连续性;

数据归档,用于存储和存取以达到长期保存的目的。毫无疑问,数据归档是数据管理员一个长期的、持续不断的策略,以当企业需要时能保证数据的可读性和可用性。在考虑把云服务作为一个适当的方式之前,企业需要认清档案系统的实质,以及其向云端进行数据归档的优点和风险。

档案系统是什么?归档市场是当今存储行业中增长最快的市场之一。也许正是因为如此,“存档”一词常常被替换成其他的名称以适应各种新发布的产品。根据归档含义,这之中很多都不是真正意义上的档案系统。档案系统集合了存储和管理数据的方法,以确保托管在该系统中的数据在任何时候都可读并可用。存储介质、特定的供应商、硬件和用于检索软件以及管理技巧都是确保数据完整性和可用性的重要因素。这些步骤包括:

数据完整性监测;

存储介质完好性监测;

硬件和软件的技术迁移策略;

智能索引(需要数据时能迅速找到;

以及保证足够冗余防止数据丢失的主动监测。数据存储在场外的AIT – 1磁带上,而又不用AIT – 1驱动器和软件索引该数据,这并不是归档系统,而是不正确的数据管理。该磁带上的数据是不可索引,也无法读取。自从其从磁带驱动器或磁带库中迁移过来,就不能使用任何方法来验证数据的持续完整性。相反,真正的归档系统能够通过可靠的迁移和数据监测确保归档数据的完好和可存取性,即使系统改变也不会有任何影响。

关于归档的一个常见的误解是,存储在归档系统中的数据时最后的一份,也是唯一的副本。其实完全不是那么回事儿。归档应用程序通常依赖于系统内数据的多个副本。这点非常重要,因为数据的完整性可通过对比两个数据副本的散列值来进行检测。因此,利用多个副本,数据管理软件在归档时可主动监测并修复数据损坏。

目前的技术能主动监测媒质的生命周期和其上面的数据情况,以确保在灾难发生后,数据能够恢复到原有的平台。但是,这项技术只能监测磁带库中的数据。其不能监测库外的磁带存储,除非有这么一项策略,周期性地库外的磁带定期放入库中进行检测。

考虑到海量的归档数据保护需求,建立一个归档系统可能让人犹豫不决。即使存储系统可以恢复数据,但其仍存在重建环境需要使用数据的问题。虚拟环境在重建备份系统方面发挥关键作用,使其能够读取归档数据。例如,想象一下10年前设计的工程示意图。如果没有恰当的操作系统和软件来查看数据的话,现代化系统毫无价值。但是,虚拟化环境能够创建恢复备份数据系统,以达到归档数据读取和恢复的目的。

云适合何种情况?云是一个用于存储数据的商业模式。无论是因为易用性、灵活性、应用程序托管或其他常见原因而迁移到云端,云提供了一个企业不需要花费大量的前期投资或对他们的IT设备进行大更换就能满足其需求的模式。在日常生活中,企业和个人无论是因为缺乏专业的知识不足以管理还是不愿管理,都可以付费让第三方来进行管理。这就比方说:很多人都为其家庭或企业聘请清洁服务,这并不是因为它很便宜,而是因为他们没有时间或不愿做。但这里面总会有一些风险(就如你雇佣了清洁服务,可能会丢东西一样)。

正是因为考虑到这些风险,就要求企业必须事先评估云归栋服务。如果你了解云归档服务的一些原则,利用服务水平协议(SLA)确保数据被妥善管理,那么云服务是一个恰当的选择。你能确定的是,不管怎样,归档数据每年都会增长。即使数据保留期满了,但根据目前的数据增长速度的趋势,新的传输到云端的数据量将大大超过被清除的数据量。从经济角度看的话,其意味着云归档成本只会不断增加。此外,存储容量灵活性的价值将越来越小,因为存储归档需求比其他任何数据类型都更可预测。

首先,归档数据必须妥善管理。如果你不能肯定云服务能够提供必要的数据管理,那么你应该谨慎行事。毕竟,数据对数据拥有者非常重要,但对服务提供商来说就不是那么回事。不管归档是选择云服务还是内部管理,重点在于归档数据的培养过程,而不是具体的解决方案。只要归档数据被妥善管理,云归档服务只是一个恰当的商业策略,根据不同企业不同的预算和人员需求,其实用性会有所不同。