信息生命周期管理漫长之旅:ILM--我们准备好了吗?

    IT主管们虽然准备进行信息生命周期管理,但是,此类工具却还没有完全到位。迄今为止,仍然没有一个用户可以实现的、成熟的企业ILM战略。 
  
    North Bronx Health Network(NBHN)是纽约著名的地区性医院网络之一,作为NBHN的首席信息官,Dan Morreale经常感觉到存储空间的捉襟见肘。他还清楚,诸如健康保险流通与责任法案(HIPAA法案)之类的政府规定正在改变着医院如何保留数据的方式。因此,HBHN准备构建新的存储体系结构。 
  
    Dan Morreale对这些问题的解决将促使他开始进行信息生命周期管理(ILM)。Morreale没有把所有100T字节的数据放在基于EMC Symmetrix的存储区域网(SAN)之上,而是选择购买另外两个更便宜、速度却稍慢的存储器:一个Centerra和一个Clariion系统。通过这种方法,医院的数据就可以根据其关键程度、需要保留时间以及用户需要以多快的速度访问它,在各层次之间移动。 
  
    如今,在存储领域里忽视ILM会被认为是跟不上时代的潮流。似乎每一家存储厂商都在兜售ILM战略。许多用户也开始随波逐流,他们把这一术语用在为了控制其日益增长的数据所做的所有努力之上,从中央备份到数据库归档。 
  
    根据ILM的出发点,ILM是各种过程、策略和技术的融合,这三者将根据用户的策略对信息进行分类,把这些信息存储在一个层次分明的体系结构之中,然后根据这些信息的价值、业务流程需求、用户访问需求以及保留/删除要求,在各层次之间透明地移动。如果部署得当,ILM系统将确保从信息生成到被删除期间,信息随着其价值的变化,在正确的时间移动至正确的地方。 
  
    ILM听起来非常象大型机世界里的分级存储管理(HSM)。然而,HSM只管理文件,而ILM战略管理的却是异构的联网环境里的结构化、半结构化和非结构化数据。HSM是根据诸如用户多长时间访问一次数据之类的客观标准来移动数据,而ILM战略考虑的却是信息的价值,使用的是诸如年限、访问频率、最后一次访问日期、文件大小、文件类型之类的参数以及管理员添加的其他标识。 
  
    ILM是漫长之旅 
  
    据分析人士称,尽管业界鼓吹了这么多,然而迄今为止,仍然没有一个用户可以实现的、成熟的企业ILM战略。尽管市场上出现了很多数据迁移、存储资源管理和SAN管理软件以及供数据库、电子邮件和文件使用的各种策略引擎、文档管理系统和数据库归档工具,然而,迄今为止能够为成熟的ILM提供支持的全面技术还没有出现。 
  
    存储分析公司Evaluator的Randy Kerns称,制定ILM战略是一项5至7年的努力,同时还需要得到整个公司的合作与支持,即使是经验最丰富的用户也还只是处于初级阶段。 
  
    Morreale称,他的系统还远远不够完备。他的小组使用EMC ControlCenter 来人工移动数据,但是,要实现自动化的基于策略的数据移动至少还需要一年的时间。此外,Morreale宁愿只使用一个控制元件之下的工具集,也不愿意管理各种不同的SQL数据流以及该小组目前用来增强ControlCenter能力的其他脚本。他还希望能够更细致地管理数据。 
  
    令人惊讶的是,数据的激增、管理数据的高成本以及日益严格的规定都增加了工作的难度。“5年前,我们有经济能力把所有的东西都存储在一个EMC Symmetrix系统里。”Kerns说,“但是,自那之后,数据增长了五倍,比存储这些数据的设备成本增长更快。” 
  
    不过,分析人士称,与其一口吞下整头ILM大象,IT小组还不如分析其信息存储和保留需求,同时进行各种跨部门讨论,以确定每个数据集的保留、访问和检索速度需求。 
  
    这些问题可能包括电子邮件增长或性能下降的数据库。据Gartner公司分析师Ray Paquet称,电子邮件归档是一个热点。他说:“人们进行电子邮件归档是为了改进性能、保留磁盘空间或者出于管理目的。”解决这些小问题不仅使项目易于管理而且可以促进投资回报(ROI)。Paquet指出:“如果项目需要6个月的时间,那么,要得到投资回报的时间可能比这多三倍。” 



    ILM是一种方法论 
  
    制定企业范围ILM战略的前期工作,是一项技术含量低但却具有挑战性的工作。许多用户需要求助于专业服务来完成这项战略工作。尽管跳过这一步很具诱惑力,但这却是至关重要的一个步骤。 
  
    分析人士建议,把数据划分为独立的三类:非结构化数据,如文件等;半结构化数据,如电子邮件等;以及结构化文件,如数据库等。这是三种独特的问题,它们需要三种独特的技术和三种独特的工具来解决。大家也可以把数据进一步划分成三个等级,针对每一等级的数据,根据可靠性、灾难恢复、备份、可用性和性能确定该数据的需求,然后,把这三个等级的数据与存储基础设施进行匹配。 
  
    但是,这不可能是个一次性的工作。数据价值在变化,因此,用户必须制定业务策略,以支持数据根据需要向更高或更低的存储层次移动。用户还必须保留元数据或者“有关数据的数据”的中央资料库。人们正在开发各种策略引擎、发现工具和其他系统,以建议什么数据应该在主观分析的基础之上进行移动,然后,对数据移动进行自动化。 
  
    尽管这一切听起来很简单,然而这项战略工作却并非一路坦途。全球性会计师事务所Grant Thornton公司IT经理Dave Johnson说:“这项工作太复杂了,因为我们公司里的许多人都可以接触到信息。”这家公司最近成立了一个特别工作小组来研究其遍布美国的50个办事处的信息流程。这包括基于纸张的文档和电子文档,其中包括存储在个人笔记本电脑里的文档,Johnson表示,这才是一个最大的挑战。 
  
    Johnson说:“我们最有价值的信息存储在笔记本电脑里。这种情况的风险很高:根据《萨班-奥西利法案》(Sarbanes-Oxley Act),你必须保留与任何重大的审计业务用有关的信息。”尽管他针对便携式计算机制定了一项集中备份战略,他却还必须为已完成的项目生成归档文件,而且,一旦出现诉讼,这些归档文件还必须能够进行搜索。其次,他还需要自动化工具,在数据不再需要保留时进行自动删除。 
  
    在他寻找完成这项工作所需的技术之前,特别工作小组必须确定一种方法,以便根据单独的项目,而不是根据这些项目所在的地理位置,来存储和归档数据。这是一项以人和过程为重点而不是以技术为重点的解决方案。技术只是在得到数据之后如何存储数据的一种方法而已。 
  
    ILM实现逻辑迁移


    在留意更全面的解决方案的同时,用类似于ILM的解决方案来解决最复杂的存储问题也是有可能的。摩托罗拉公司全球IT配置经理Bill Brewer称,在该公司,个人通信部门(PCS)内存在的最大的存储忧虑就是其Oracle数据库的性能和如何符合相关法律。 
  
    Brewer选择了出自OuterBay技术公司的数据库归档软件,把已有15个多月历史的客户会计信息从生产数据库迁移至EMC Symmetrix SAN。这个解决方案使数据库的性能提高了68%,同时保持所需数据一直在线且易于访问,而且也不会消耗生产服务器空间。Brewer表示,他希望最终合并不太昂贵的基于Clariion的存储,以便在保持无缝的终端用户访问的同时,进一步降低存储成本。他目前的外购合同只允许他使用EMC Symmetrix系统。 
  
    Brewer说:“我们希望实现的目标就是,归档数据移动到最便宜的存储,而高性能数据则继续留在生产ERP模式上。”在部署OuterBay软件之前,Brewer需要为在美国的PCS商业部门制定业务规则。他说:“我们的ERP系统存在于多个国家,每个国家都制定了规则。”例如,墨西哥的保留期限是10年,而中国的保留期限则是20年。OuterBay系统还允许他制定其他规则,例如:如果交易是公开的,或者,如果交易的截止日期还没到,就不需要进行归档等等。 
  
    有关ILM不好的消息就是:前期工作可能令人畏缩,技术不成熟而且昂贵,此外,还有大量的内部策略需要处理。例如,如果IT无法与业务负责人进行沟通,甚至无法让数据库管理员与存储经理交谈,那么,ILM什么也做不了。 
  
    好消息则是:不论采取什么行动来分析信息或者改进数据管理,这都是朝着正确方向迈出的一步。如果用户所做的只是对数据进行分类以及了解使用和访问模式,这也是非常有意义的事情。即使用户只是把新数据放在一个层次分明的基础设施里,也将看到巨大的成本节约。 
  
    对于诸如Morreale之类的用户而言,重要的就是马上行动起来。他说:“即使我知道全面的技术并未到位,我也会行动起来的。在存储应用中的创新将使我们在面对将来的复杂情况时占得先机。” 
  
    ILM是什么? 
  
    信息生命周期管理有各种策略、过程、实践和工具组成,从开始构思信息到信息被处置期间,这些策略、过程、实践和工具都被用来使信息的商业价值与最合适、最具成本效益的IT基础设施保持一致。通过对应用、数据和元数据相关的策略和服务水平的管理使信息与业务流程保持一致。