存储分析:选择数据归档软件的最佳实践

有许多重要的数据归档最佳方案,但是最重要的方案(却很少被遵循)只是简单地进行归档和使用数据归档软件。大多数的人都将他们的备份作为归档,很难想象,这样当你有归档需求时,会有多糟糕。我们不能本末倒置,让我们先确定你的需求。

根据你的行业不同,实际上你可能没有数据归档的需求。金融贸易公司需要归档所有与客户的通信信息。任何接受1996年颁布的美国健康保险流通与责任法令的人都有严格而长期的存储需求,因为他们必须存储病人生前所有的数据。经常面临知识产权和专利的法律诉讼的公司,也许需要归档这些材料来证明他们确实是第一个实现这些专利的。因此最好的方法就是与各利益相关方召开会议,并询问他们有什么长期存储需求。法律部门也应该参加每一次会议,从而确保他们每一个要求都合法。

这是“少就意味着多”的领域之一。我无法表述得比这更简洁了“如果你没有归档需求,那就不要归档”。将数据保留到超过你实际需要保留的时间,很可能带来的坏处要多于益处,尤其当你生活在美国(历史上最好诉讼的社会)。联邦政府的民事诉讼准则明确说明如果你拥有它,你就必须放弃。想象一下如果你不需要将电子邮件保存几年,但是你却保存了。即使你的公司没有犯任何错误,你也会在你的存储部门将这些信息提供给诉讼的原告时产生巨大的负担。然而,如果你的方案是定期清理这些数据,则不需要提供任何数据。

记录你的数据保留方案

一旦你确定了哪些数据是你将要归档的,以及哪些是不需要归档的(这点更重要),那么你需要记录下你的数据保留方案。记载哪些是需要保留,哪些不需要,以及你的数据销毁方案。例如,方案中可以申明:所有不遵循归档要求的数据,在保留180天后被销毁。然后,你需遵循这一方案去记录。相比于你制定了数据保留180天的政策,你更需要做的是在180天后删除这些数据。(过期的备份磁带仍然是会被发现的,你将会被要求把它们扫描到你的备份系统,那是多么的痛苦!)

如果是我,要做的是写一个脚本查找过期的备份磁带然后重新标识它们,首先,磁盘上的最后一个和唯一的文件将是ANSI标签,该标签被备份软件当做电子标签使用。因为它是磁带上最后的文件,所以在它后面是一个数据结束标记,这样将不可能通过任何磁带驱动器或者虚拟磁带驱动器得到这些数据。因此,尽管有一些技术数据保存在磁带的剩余部分,也没有任何方法获得它。也就是说,它们将不可能被发现。记载这个方案和脚本,然后记录每隔一段时间的审查实践工作,包括文档。如果你想要打官司并且在法庭上说你的备份在多天后不被发现,那么你真的需要准备妥当。但是如果你按照以上的建议来执行,你将会很安全。

选择数据归档软件

你已经确定了你将要归档的数据,现在你需要决定怎样归档这些数据,让我们回到这篇文章的第一句话—-你需要使用真正的数据归档软件。什么是数据归档软件?它是一种允许你通过不同上下文进行搜索的软件,而不仅仅是通过服务器、应用程序或目录,文件名或者邮件。所有数据备份软件能做的是:在某一个时间点,从已知的服务器目录或者应用下抓取一个已知的文件或电子邮件。这是它唯一知道的情况。另一方面,归档软件需要能够在一段时间内—-有可能长达七年,在多台服务器的多个目录和应用下抓取一系列的电子邮件或文件。这个领域的产品生产商主要有Autonomy Zantaz、Iron Mountain/Mimosa NearPoint以及Symantec公司。当然,在数据归档软件市场还有一些其他的合适的参与者。

数据备份和数据归档软件之间的不同,类似于恢复(备份软件做的工作)和检索(归档软件做的工作)之间的不同。

一个恢复请求可能是:“给我elvis于2010年7月30号存放在/home/curtis/目录下的thing.doc文件”。

一个恢复请求可能是:“给我Curtis于2010年7月25号发过来的主题为Whatzamajigger的邮件”。

一个检索请求可能是:“给我所有服务器上,创建于2007年7月1号到2010年7月1号,包含‘project bilko’内容的所有不同类型的文件”。

一个检索请求可能是:“给我所有在2003年7月1号到2010年7月1号期间,Curtis发给公司外部人员的包含‘promise’或者‘guarantee’内容的邮件”。

你是否已经明白这些请求之间的不同?你能否想象使用标准备份软件来满足后两个请求?如果你运气不够好,有过去七年电子邮件系统每周的全备份。那么你需要对电子邮件系统执行364次恢复来提取需要的数据。此外,你邮件系统的备份仅仅能够恢复到当时你使用的电子邮件软件版本,并且只能运行在当时使用的操作系统上,每一个版本都有它们对应的补丁级别等。如果你有归档需求,你肯定不想使用上述方法,你会希望使用数据归档软件。

一些备份软件已经开始拥有归档检索能力,因此,在开始你归档搜索之前你可以和你的备份软件供应商谈谈—-你可能已经有了你所需要的!然而,如果没有,你需要着手选择一个合适的电子邮件搜索或者文件系统归档的工具。然后记得在这些工具部署之前做一个完全的概念证明测试:它们不完全是一样的。最后祝你好运。