细读SNIA更新XAM标准后如何解决长期归档问题

DoSTOR存储分析:固定内容数据包括那些不随时间变化的数据,例如数字图片、电子邮件讯息、演讲报告、视频内容和支票图像等。固定内容数据必须长期保存,经常是为了遵从政府规定的保存期限。一些行业分析师认为固定内容的数据量增长速度要比事务数据量的增长速度还要快,而且很可能将在近几年内占到所有公司数据的一半以上。

没有一种可行的长期策略能够保证数字信息在未来也能保持其可读性。由于存储介质的退化和老化,数字文档将很脆弱,而如果编译这些数据的软件或该软件所依赖的硬件过时,那么这些数据也不能访问和读取。

过去,存储厂商解决这种问题的方法是采用如内容感知存储(CAS)这样的新技术。CAS用于在长期内存储大量的固定内容数据。同专注于简化存储合作和文件共享的NAS(网络附加存储),或者专注于数据共享和性能的SAN(存储局域网)相比,CAS是专门用于固定内容存储,这种固定内容存储和事务数据相比具有明显更长的生命周期。

CAS主要的访问方式是通过应用程序编程接口(API),这种API须支持其元数据和CAS其他的先进功能。此外,CAS存储设备也可以选择通过传统的方法来进行访问,例如NAS协议、FTP和HTTP,但是这种方式要牺牲一些功能。

但是由于CAS的所有权属性,存储网络行业协会(SNIA)认为长期数字信息存储问题需要一个更好的解决方案,这种解决方案应该不需要在每次格式、软件、硬件、文档类型或记录保持操作发生改变的时候都进行人工干预。这种方法应该是具有可扩展性,而且能够以统一的方式处理现有的文件类型和未来可能出现的而现在未知的文件类型。这就是SNIA正在发展的eXensible Access Method(XAM:扩展访问办法)规范。

XAM带给归档的益处

由于XAM将软件应用程序从存储平台中分离出来,因此应用程序和数据将能够在应用程序和所承载的存储设备之间自由移动。

通过XAM,由于对象是独立于平台且不受文件系统限制所约束,因此可以存储无数对象;且由于元数据和对象捆绑在一起,因此不需要涉及应用程序就可以进行归档查询。

即将来临的XAM

根据企业策略集团(ESG)的说法,固定内容数据正在以每年92%的速度增长。所有的归档都使用一定形式的元数据来对归档对象进行描述、重新使用、管理和保存。XAM为应用程序提供一个标准的接口和标准的元数据来在各种固定内容间进行通信,通过这种方式,XAM能够解决快速增长且越来越重要的固定内容存储的问题。

XAM接口规范定义了一个标准的固定内容"客户"(应用程序和管理软件)和"提供者"(存储系统)之间的访问方法。XAM可以为对象加注元数据,使得管理者在对象管理上可以设定策略对进行智能决策,而不用回溯到原有的应用程序。XAM所带来的益处包括如下:

XAM把内容作为包括数据和加注的元数据的"对象"进行存储。一个例子就是X射线图被作为数据组件进行存储,而患者的名字和其他医疗记录信息被作为附加元数据进行存储。元数据可以用统一格式进行存储,这种统一格式可以编制索引并被独立的工具所查询。同时,元数据可以帮助记录和保存重要的关于数据的背景信息,而这些信息可以在多年后帮助我们处理和使用这些数据。

XAM为每个对象产生一个全局的唯一的名字(地址),这个名字(地址)独立于当前的计算机环境、组织、地址或技术。因此,对象可以在任意时间进行移动、改变物理或技术地址;对于当前用户来说对象是完全透明的。这种属性对于透明的信息生命周期管理(ILM)来说非常重要;而且XAM排除了使用私有API的需要。

XAM带给ILM的益处

基于XAM的技术的出现和采用将会给ILM实践的采用和施行带来积极的影响。XAM为所存储的对象提供了一个独立于地址的方式,可以有效管理内容而不需要涉及应用程序(这种应用程序可能需要在特定的物理地址)或其所依赖的技术。

XAM同时也将元数据(关于所存储内容的数据)中所包含背景信息的重要性提升到和内容本身同样的水平。通过将内容和元数据绑定在一起,应用程序可以方便地对所存储内容的信息进行管理和共享。同时,作为应用程序和物理存储之间的接口,XAM元数据使得管理者在对象管理上可以设定策略对进行智能决策,而不用回溯到原有的应用程序–这正是ILM的一个主要目标。

随着时间,符合XAM的设备将成为进行长时间商业数据保存的一条可行途径。从数据保存的角度,通过将存储的物理资产抽象出来,虽然承载存储的设备会逐渐老化并达到其产品的生命周期,但是XAM架构仍然可以为所管理的内容以及其所有属性提供一个连续的架构。这种能力非常重要,因为自适应数据中心的物理存储设备也会逐步老化并被更换,但是通过抽象化不同类型的资源,数据中心还是可以保持其各种服务。

此外,根据SNIA数据管理论坛(DMF)100年归档要求调查报告(www.snia-dmf.org/100year),制订利用XAM的"归档信息包"的ISO标准的工作正在进行中,这种概念可以用于开放档案信息系统(OAIS)的利用和整合,并在未来用于解决逻辑迁移的问题。该接口的目的是提供互操作性、存储透明性、长期记录保持、信息保障(安全)和为ILM工作提供自动化。

最后,终端用户可以从存储技术独立性以及数据可移动性的增加中获益。此外,它还可以缓解,在电子归档(一般三到五年进行一次)中进行不同存储设备的数据迁移所遇到的一些问题。

正是因为认识到了这些益处,来自45个代表各自的存储厂商、应用程序提供商和终端用户公司的超过95名人员参与到了XAM规范制订的工作中。第一个基于XAM的概念示范在2007年的达拉斯存储网络世界大会上得到展示。如需更多信息,请访问www.snia.org/forums/xam。Christina Casten是存储网络行业协会XAM行动的联合主席。

背景资料

存储网络行业协会XAM行动

存储网络行业协会XAM行动的目标是推动未来的扩展访问方法(XAM)规范的使用。该行动将服务于XAM团体,包括存储厂商、独立软件厂商、以及终端用户,以保证该规范满足固定内容数据管理接口标准的市场需求。这些需求包括互操作性、信息保证(安全)、存储透明性、长期记录保持、以及ILM工作的自动化。加入XAM行动,请访问www.snia.org/xami/join。

FCAS工作组

固定内容感知存储(FCAS)工作组的作用是作为一个技术活动的中心来帮助实现新的针对固定数据(固定内容)存储以及相关的不同命名框架下元数据的应用程序层次的接口,包括CAS和全局独立内容标志符。

XAM软件开发工具集技术工作小组

XAM软件开发工具集技术工作小组被授权开发可以执行现有及未来FCAS技术工作组XAM规范版本的软件。该软件(二进制码和源代码)将通过SNIA软件开发流程,并将对非SNIA成员开放。