应对数据爆棚:长期保留数据的十大窍门

服务器在线12月29日报道 电子数据的发展正在遭遇失控的威胁。根据IDC咨询公司的市场调研结果显示,今年产生和复制的信息量已经超过了452exabytes(资料存储单位,1exabytes相当于10亿G字节),这个数据量已经高出了全球可供使用的存储总容量。

并非所有的数据都需要保存。但根据IDC咨询公司的报告称,保留重要信息的努力受到了多重因素的制约:诸如用户对于长期的电子数据存取会产生问题的担忧,保存的数据量过大而难以承受,资金的不足,数据的混乱,缺乏管理者的足够重视等。由来自知名大学,一流图书馆和微软公司专家组成的Sustainable Digital Preservation and Access的蓝缎带任务组表示,数据保存需要更好的形式,这也需要全球范围内的共同合作。

在线计算机图书馆中心兼任务组主席的布莱恩.拉弗在新闻发布会上表示"对有价值的电子资料的长期性存取和使用需要由持续性经济支持的电子保存行为,换句话说,要具备充足的资金支持和经常性的其他资源支持才能实现长期目标"。

尽管任务组表示需要整个业界的解决方案,但作为个体的IT部门显然也需要采取很多步骤来执行更好的数据保存计划。美国加利福尼亚大学的圣迭戈超级计算机中心总监兼任务组的副主席弗兰.伯曼为数据保存提供了十大窍门供用户参考。

下面就让我们一起来看看伯曼的建议:

1.在数据的生命周期从头到尾的过程中,都对数据的保存和管理制定详细的计划。

2.了解硬件,软件,支持和时间在内的数据成本并将他们计算在整体IT预算之内。决定是否有更划算的解决方案来重建部分信息,而不是长期保留。

3.将共同数据与你的数据想关联。识别数据,共同数据内容和模式的相关标准,遵循这些标准来确保数据能被其他相关数据所使用。

4.为有价值的数据制作多个副本。将这些副本离线存储和保存在不同的系统中。

5.在电子数据向新的存储媒体传输前提前进行计划。为新的存储,软件技术,文件模板迁移和时间准备预算。在你的存储媒介作废前就将数据迁移至新的存储空间。

6.对数据的管理和传输进行规划。如果数据最终将用于模板库或其他保管环境,要确认它符合新环境的要求。

7.在选择如何对数据进行归档时需要对信用级别进行评定。是美国国家档案和记录管理局的级别还是谷歌搜索的需求?

8.根据用户的特殊需求量体裁衣制定数据保存和存取计划。举例来说,由全球成千上百名研究学者日常使用数据所需的数据保存和存取基础架构可能就会与普通家庭成员日常浏览电子照片所需的基础架构时不同的。

9.关注安全性。要明白维护数据的完整性必须要做些什么。

10.了解规章制度,了解版权归属。1996年颁布的健康保险责任法案和2002年颁布的Sarbanes-Oxley法案。 美国国家保险出版机构或者其他协议都与数据保存有关。