内容归档 数据中心时代的核心基建投资

    数据中心时代已经到来
  
    尽管中国经济处于发展中国家的地位,但在IT建设方面,尤其是在金融、电信、政府、商业服务等领域,实际上一直紧跟全球热点,而且目前已相对完善,正如IT业流行的“与世界同步”说法,在经历了以计算为中心的主频时代,以网络为中心的互联时代之后,中国的这些行业也迎来了以数据为中心的存储时代。
  
    SUN公司旗下的StorageTek品牌和其它专业存储厂商一直以来所倡导的信息生命周期(ILM)理论,非常贴切地解读了“以数据为中心”的IT应用需求,针对有生命的信息(即数据)在产生、交互、保存的不同阶段,采取不同的管理策略,根据数据对企业生存的关键性以及为企业发展带来的价值决定其存储的方式,从而实现“适当的数据,在适当的时间,以适当的费用,存储在适当的设备上”,内容归档市场因此应用而生。
  
    关于归档针对的数据,ESG(企业存储研究集团)提出了“可访问的信息”(Reference Information)概念,“保留这些数字资产(即内容归档)的目的是为了提供参考和产生价值”,“它包括(但不仅限于)电子文件,如:合同、email、email附件、讲稿、CAD/CAM设计、原代码、Web内容;以及一些数字化的影像信息,如:支票影像、蓝图、历史文件、医疗影像、地理数据、生物信息、录像、声音数据、以及照片。”
  
    如上所述,SUN StorageTek认为,与传统的备份完全不同,归档针对的数据是不曾被修改过的原始数据,其中包括法律法规要求的全部数据,其保留期限以年甚至世纪为计,“一次写入,多次读出”是这些数据重要特征;从保证数据完整性角度出发,这些数据一般不会随便做更改,而且一般都放在二级存储的近线设备上,如磁带库等;而备份仅是对数据的复制,是二手的资料,数据的保留期限是以星期或月为单位计算。另外,归档要保证取回数据的可用性,备份则仅是强调在遇到故障和灾难时的数据恢复。
  
    从某种角度上讲,内容归档并不是一个很新的需求,2000年之前就已存在,只是随着法律法规对此方面的要求越来越严格,随着信息沟通能力成为企业核心竞争力的一部分,企业需要长久保存和随时调用的信息每年在以2倍的速度增长,已经达到了海量的程度,直接促使实现内容归档的产品和解决方案日臻完善。
  
    而随着电子商务应用呈爆炸式增长,国内外针对电子邮件的相关法律法规越来越明确,而且电子邮件所管理的信息每天在跳跃式地增长,已成为业务交易的重要媒介,这些交易记录必须作为公司资产不能只是由每个人来保管。每天成千上万产生的电子邮件和业务文档,同时占据了用户和服务器的很多空间,这也直接影响了应用的性能,加大了企业计算机部门的负担,一个有效的电子邮件归档解决方案就显得极其重要,并成为内容归档的一个重要分支。
  
    SUN StorageTek认为,尽管电子邮件的容量很大,但其仍然是内容归档的一部分,所以企业仍需制定统一的归档策略,形成统一的归档系统,在这一系统内部,形成相对独立的电子邮件归档系统,更能够契合统一的归档策略,更利于业务的关联性和扩展性。
  
    定义数据与核算成本 规划内容归档的第一步
  
    数据生成后,随着时间的推移,其访问频率将逐步下降,数据被保留的时间越来越长,被消除的数据越来越少,重视TCO(整体拥有成本)的企业,都需将不常访问的数据迁移到较便宜的介质上,节省存储投资。因此,SUN StorageTek认为,企业在进行内容归档建设之前,首先要对需要归档的业务数据进行分类,然后根据数据的容量、保存的时间、访问的频率,反应的速度这四个必须考虑的因素,进行量身定做。
  
    各个行业的需求特点不同,技术手段和应用特点也就不同。SUN StorageTek目前将存储系统定义为一个3层的结构,也就是经常提到的D-D-T架构,即从“生产系统磁盘”到“二级存储设备”或“虚拟磁带库”再到“磁带库”的总体解决方案。
  
    以电信业为例,其特点是数据量大,在数据产生的头3-6月内,访问的频率高,而且反应时间要快,SUN StorageTek提供了前端是虚拟磁带库作为查询系统归档,后端是大型磁带库作为历史数据归档,同时提供快速的查询、恢复手段的解决方案。这样,通信公司可以将每个客户的3个或6个月的话费清单存储在当前的比较昂贵的生产系统磁盘中,而将该客户3个或6个月以上的清单存放、迁移到相对价格低很多的二级磁盘系统中,而将更早期的历史数据存放在磁带库里面。这一方式可以使运营商提高对客户服务的等级,从而增强了竞争能力。这也是SUN StorageTek所倡导的存储信息生命周期架构的一个最好的体现。
  
    以SUN StorageTek在华东地区一些银行的应用为例,其特点是数据量大,保存时间长达20年,访问的频率低,所以以大型磁带库为核心产品的解决方案是最合适的选择。
  
    应对数据量不大,归档周期不长,但反应速度很快的企业,磁盘阵列是一个很好的选择,但在任何情况下,基于安全的考虑,都会建议其在后端加一个磁带库,将一些重要的数据实行异地磁带存放,SUN StorageTek认为,这样做的好处是磁带无电流要求,省电,费用低可以复制多份放其在多个安全可靠的地方。这类应用大多集中于制造业,在产品设计和生产的初期,有一些需要大家共享的文件,如一些图纸需要经常更新和访问,这就需要磁盘阵列来配合,在后期则需要将最终确认的图纸等相关数据存放在一个安全的磁带库上,以满足未来查证等方面的需求。
  
    存储增长的速度已经超过磁盘降价的速度,不断对企业的预算提出挑战,这种情况下,首先要满足企业的核心需求,同时考虑长远投资。如我们所知,磁带的成本一般是磁盘成本的十分之一,因此当企业预算有限且最重要的考虑是数据保护时,磁带库是最佳的选择,而根据数据量和访问特点的不同,以不同容量的虚拟磁带库或磁盘阵列做配合,就成为匹配不同需求的重要手段。
  
    从上面的分析可以看出,在数据为中心的时代,磁带库不仅不像许多人认为的那样会消亡,而且更会有大展拳脚的机会。
  
    兼容性、简便性和扩展性 实施内容归档三个要素
   
    内容存档是在原来IT建设上新增的业务需求,需要面对许多现存的和未来的应用、以及软硬件的环境,新增投资的兼容性就显得相当重要。另一方面,存储管理的效率很难跟上存储容量增长的速度,技能不高且非常缺乏的IT人员却要面对越来越复杂的存储架构,因此既要方便地管理许多的机器和应用,又要有统一的、自动化的办法,让使用者准确快速地从归档数据中查询到所需要的文件,这就对管理的简便性提出了要求。
  
    对于快速转移文件甚至在几分钟内恢复最大数据文件的能力来说,软件是一个关键的因素。SUN StorageTek的Application Storage Manager® (ASM) 软件利用存储虚拟化,并通过用户定义的数据策略在整个存储层次结构中自动执行数据管理和检索。这些数据策略既可专用于单个应用程序,也可专用于共享由磁盘和磁带组成的公共存储系统的文件组。在任何时候,数据都能从任何存储分层进行访问。ASM 的优点是将数据从磁盘缓存卸载到了磁带,从而使企业能够平衡成本、性能和容量,降低整体拥有成本。除进行文件归档外,ASM软件还能归档目录和文件位置。
  
    企业的数据在以指数的速度增长,所以升级性和投资保护也是企业须考虑的问题,尽管目前量小,预算少,但一个非常完善的架构,将有利于未来的升级和扩展。STK面向大型应用的VSM系统和面向中小型企业的VTL系统将在开放的角度上,在系统架构上很好地体现了兼容性、简便性和扩展性。
  
    顾问服务,事半功倍实施内容归档
  
    面对专业的应用,归档后的数据一定要能够方便地进行分析和筛选,实际上,在内容归档方案实施之前就已在考虑之中,Sun StorageTek会帮助客户其分析数据,确定进行数据分类和筛选的方式,以便更有效地提升业务运转能力。
  
    而且内容归档建设往往不是独立的,一般会围绕业务系统来做,要汇同存储管理、数据保护和智能的数据存档等多个方面来考虑,要考虑整体IT系统的运算能力和生产力,顾问服务也自然成了存储企业核心竞争力的一部分,实际上也为企业提供了更为广阔的竞争舞台。
  
    查看历年的报表,无论是国内还是国外,顾问服务都占据了Sun StorageTek收入很大的一部分,而且每年都会有许多外国的专家来到中国,帮助国内的客户提供内容归档的顾问服务,而从实际效果来看,确实已经收到了非常好的回报。
  
    在银行、电信、新闻传播等行业,Sun StorageTek在内容归档方面的解决方案得到了客户较高的评价。以上海某商业银行总部的数据中心为例,尽管其目前数据量不是特别大,但一方面产生的数据存放周期很长、增长很快,另一方面其OA系统所对应产生的电子邮件和应用文档需要有效归档,所以就涉及到一个较为复杂的应用。
  
    针对业务数据,这家银行目前配备了目前容量最大的SL8500自动磁带库,目前使用了1500个槽位,以每个槽位200GB的非压缩存储能力计算,总容量已达到300TB,SL8500最多可以添加多个存储扩充模块(SEM),使单台磁带库的可以存储6,500多盘磁带。在不久的将来,SL8500单台磁带库的可以存储超过10,000 盘磁带。级联多个库体可使总槽位数可以超过300,000个,使整个系统有非常好的扩展性。SL8500可以根据需要提供4个或8个机械手来满足业界最高的可靠性需求。
  
    此外,SL8500可以按照用户需要来提供容量。例如,一个用户目前需要个1700 槽左右的磁带库,在未来几年内容量需求会逐步增加到4000槽左右。但是用户要求升级时不能中断磁带库的运行。那么交付用户的SL8500 将配置了两个SEM,实际的存储容量可以达到4500槽,但是Sun StorageTek开始只向用户收取 1750槽的许可费用,当用户需要增加容量时,再向Sun StorageTek购买更高的存储容量的许可。激活新容量是由Sun StorageTek的客户工程师利用新许可来更改设置定义即可完成,不需要中断磁带库的运行。
  
    针对OA办公,因为需要快速查询,所以需要配备虚拟磁带库,目前已经进入了实施筹备阶段,此外,最近这家银行又新增加了20TB磁带库用于容灾。
  
    可以说,在实际应用过程中,无论是电子邮件归档,还是内容归档,都已经变成企业提升信息沟通能力不可或缺的重要手段。