中国计算机报:信息归档与法规遵从并驾齐驱

    长期信息归档的问题主要来自与日剧增的电子邮件和非结构化文件的数量,而法规遵从则必须满足外部法规的要求。但无论是进行信息归档还是法规遵从流程,大多数存储基础架构的要求是相同的。


    最近,媒体报道了几起信用卡和其他个人数据遭到破坏的事件引起了社会关注。这使得企业意识到,迫切需要保护数据,以防被盗。


    数据的长期存储,除了存储数据本身,还必须考虑数据的存储方式、存储格式以及读取数据需要的工具等众多因素。一般来说,存储时间越长,难度就越大,而现在的法规要求数据存储至少3年、5年、7年、30年甚至更长时间。因此,企业应该力求不要做出会在将来限制其选择权的决定,而应尽可能地保持硬件、软件的灵活性。否则,一旦存储的文件必须由专有软件、专用驱动器才能打开,多年以后,这将变成非常棘手的问题。


    本文列举了几个注意事项,希望能为企业在设计、部署信息归档、法规遵从等长期数据存储应用提供一些参考。


    避免采用存储竖井


    长期信息归档的问题主要来自与日剧增的电子邮件和非结构化文件的数量,而法规遵从则必须满足外部法规的要求。但无论是进行信息归档还是法规遵从流程,大多数存储基础架构的要求是相同的。


    从存储角度来看,实际上仅有两个主要的区别:信息归档由邮箱管理的需求主导,这通常包括利用分层存储将电子邮件从主电子邮件服务器的存储设备移动到成本更低廉的辅助存储设备中;法规遵从要求数据的绝对稳定性,即今后数年之内,数据应达到能够将每个错误操作、错误决定和病毒都排除在外的稳定程度。


    由于基本存储要求类似,因此只要有可能,就应尝试使用相同的基础架构来满足长期存储要求。相反,如果将信息归档和法规遵从的存储架构与企业日常存储分开,这将显著增加管理的复杂性,并制约未来需求适应的灵活性。


    避免专有数据格式和技术


    以WordStar文档为例,这一曾经风光一时的文档格式早已无人问津。不可否认,5.25英寸的软盘曾是很好的存储介质,但现在却无法找到可以读取它的驱动器,也无法将文件复制到其他介质上再打开。


    其实,迅速从主流成为过时的存储设备远不止它一个。因此,在评估信息归档和法规遵从的存储解决方案时,应该重点考虑开放的、基于标准的解决方案。


    以下是设计与部署存储系统前需要询问的几个关键问题。


    1. 使用什么格式存储数据?应尽可能将文件数据以其原始格式进行存储。


    2. 迁移到新存储设备的难易程度如何?如果数据将存储若干年,最终肯定需要迁移到新存储设备中。一旦数据以专用格式存储,将来的迁移就会更为复杂。


    3. 支持哪些访问协议?如果只能使用一种协议访问数据,最终将受到制约,所以应选择使用多种标准协议。


    4. 支持哪些信息归档和法规遵从应用程序,它们是如何整合的?一个出色的长期存储解决方案必须支持用于电子邮件信息归档、法规遵从等主要应用程序。此外,用户还需要考虑这些应用程序是如何整合的?该存储系统具有该应用程序必须遵循的专用API,还是使用标准访问协议?一般来说,专用API会使应用程序供应商在支持特定平台时难度更大。


    在按照法律必须将数据保留若干年的企业环境中,保持灵活性的最佳做法是尽可能将数据以其原始格式保存,并可使用标准协议进行访问。在过去五年里已出现了越来越多的安全体系结构(如Active Directory),建议将法规遵从解决方案整合到这些安全体系中,这样可允许单个用户对文件级别进行控制。解决方案越刚性,日后处理时费时会越多。


    不要有意识地缩小选择范围


    任何技术预测基本上都是错误的。这些错误的严重程度决定了用户使用它们会付出的代价。因此,在处理必须保存若干年的数据时,从一开始就缩小选择范围的策略是很不妥当的。根据现时环境和要求,可能决定现在不去实施某些功能,但这并不等于将它们拒之门外或在今后都完全放弃这些功能。


    此外,还应考虑将来可能需要的功能。如果解决方案中包含ATA磁盘(一般认为这种磁盘不如光纤通道磁盘可靠),那仅有标准的RAID就足够了,还是必需要有双奇偶校验的RAID?如果需要双奇偶校验RAID,那么所选的解决方案就能够完全提供现在和将来所需的性能吗?


    注重性能


    以前,没有人认为性能会是磁盘信息归档和法规遵从的重大因素,IT部门主要考虑的是低成本、可靠的存储设备。但是,市场变化了。现在,用户常常需要进行大量的信息找寻工作,而且不仅仅局限于电子邮件,还包括家庭地址、即时消息、数字图像、电话记录和数据库记录等,要满足这些需要,就必须确保足够优越的性能。


    就电子邮件信息归档而言,必须确保具有同时进行若干活动的性能,以确保阅读邮件、搜索、删除等功能可以同时进行。现在,很多用户转向NetApp,正是因为认识到市场的变化及其对产品性能的需求。


    利用存储虚拟化技术


    存储虚拟化技术是当前的热点话题。确实,谁不想要一个无限大的存储池呢? 但是,如果要满足信息归档和法规遵从的需求,就应该选择在存储池无限大和文件系统的粒度控制方面都突出的技术。


    拥有大型存储池无疑可以简化信息归档体系结构。这种类型的存储虚拟化技术可以使添加所需的其他存储设备变得简单,并在必要时调整卷大小以适应策略的更改。另外,因为在发出搜索请求时仪表将开始运行,所以对数据进行粒度访问和控制也是至关重要的。


    仔细考虑加密问题


    最近,新闻媒体报道了几起信用卡和其他个人数据遭到破坏的事件。这使得企业意识到,迫切需要保护数据,以防被盗。美国FBI调查显示,50%~80%的攻击来自防火墙内部,这使得对有价值的商业秘密、财务数据和客户记录进行加密保护成了最佳选择。即使没有要求法规遵从,企业也意识到了加密的重要性。大多数行业专家都认为,由于电子邮件和电子邮件信息归档包含了知识产权和机密信息,对它们进行加密将成为一种长期的趋势。


    由于安全性对法规遵从来说特别重要,许多客户希望对这些数据进行加密处理。加密带来的一个潜在问题是:根据所使用的加密方式不同,相同的输入数据块(明文)可能会被译成不同的输出数据块(密文)。如果输入的是两个完全相同的文件,那么输出将是两个不同的文件。这将大大影响单实例存储策略,还可能提高存储的要求。


    如果要加密数据,最好在数据输入系统之前对其进行加密。由于加密通常是在第三方服务器或设备(如Decru系统)上进行的,因此可能认为发生情况后增加相应功能比较容易,但在对已经进入法规遵从程序的数据进行加密之前,必须三思而后行。


    另外一个问题是,加密会更改数据。如果存储系统中已经存在未加密的数据,则无法更改。如果对其进行加密,则需要两倍的存储容量和审计,以确定在加密过程(也称为监管链)中数据本身不会更改。许多信息归档和法规遵从软件包的确包含加密选项,但这种折衷的办法往往会对信息归档系统的性能造成影响,或增加对服务器的要求。


    要灵活


    现在,信息归档和法规遵从中惟一确定不变的是,它总在变化。虽然无法预测所有的可能性,但如果使用了开放式数据格式和体系结构,并且具有多种选择可能性,在部署法规遵从解决方案时就具有很大的优势。


    使用正确的流程支持法规遵从


    任何厂商最新、最好的技术都无法确保法规遵从。以下几点是目前普遍受到关注的关键性流程。



  • 审计和记录所有媒体或系统的物理访问和维护,并且必须获得控制源的预先批准;

  • 备有一个安全日志,用来记录对法规遵从解决方案所做的所有配置更改;

  • 需要提供可审计的拓扑和工作流报告,用于说明数据如何进入法规遵从存储设备;

  • 必须能够实现审计跟踪,以便进行故障补救,换言之,如果发生故障,将采取哪些步骤使系统再次符合法规遵从的要求,以及怎样才能知道已经恢复成功;

  • 随着时间的推移,必须有一种验证、审计数据质量和准确性的方法。