主流的存储和主机厂商追捧 CAS能否卷土重来

      CAS是英文“Content Addressing storage”的缩写,中文意为固定内容寻址存储。这里所指的固定内容就是指一旦生成就不再发生改变的信息,比如数字媒体(图像、音视频等)、法律和参考文档、医疗影像、电子邮件、银行票据等。其实早在2002年,EMC就推出了CAS存储,只是由于当时的市场环境对于CAS的需求并不旺盛而未能引起人们的关注。但随着近几年数字内容的急剧增长,CAS再度引起了存储厂商的关注,那么这次CAS真的能够卷土重来而成为继SAN、NAS之后的存储领域的第三驾马车吗?
  
      固定内容激增 CAS再受重视
  
      据IDC最新发布的数字统计,2006年制造、复制出的数字信息量共计1610亿GB,开启了前所未有的信息增长时期。这些数字信息大约是现有书籍所含信息的300万倍,如果将所有书籍排列起来,总长度为地球到太阳距离(约1.5亿公里)的12倍。IDC报告同时显示,到2010年,这个数字将猛增到6倍,达9880亿GB,年复合增长率为57%。
  
      在这些数据当中,绝大多数都是所谓的固定内容??这些信息一旦生成就不再变更,类似于光盘存储中的WORM(Write Once Read Many)盘片,一次写入,多次读取。根据美国加州大学伯克利分校所做的调查显示,在全社会每年产生的所有信息中,有超过75%的信息是都属于这类固定内容数据。固定内容的信息存储主要包括各类法律条文、标准和规范的电子文档以及数字化医学信息、电子邮件及附件、支票图像、卫星图像、音频/视频信息等。因此,固定内容的增长是现代信息膨胀的重头。
  
      除了固定内容的大量增长外,法律体系的成熟也对CAS市场的兴起起到了推波助澜的作用。
  
      例如美国众多联邦法案对电子记录在完整性、保密性和可存取性三个方面作出了明确的规定。在中国,国家有关部门也越来越重视数字化信息的法律地位。2006年出台的中国人民银行办公厅关于印发《全国支票影像交换系统业务处理及系统运行有关管理规定》的通知规定:“(支票)影像交换系统应用软件开发文档保存期限为该应用软件停止使用后5年;其他运行文档应比照同类会计档案确定保存期限。”2005年修订的《证券法》对投资者在证券公司开户以及开户时所提供的各种信息,规定了20年的保存期限。而在医疗领域,我国则规定“门(急)诊病历档案的保存时间自患者最后一次就诊之日起不少于15年”。
  
      目前,这种催熟作用已经初现端倪,国内许多企、事业单位已经着手改造自己的网络存储设备,以适应法律遵从方面的需求。
  
      正是鉴于上述市场急剧增长和法律法规的要求,CAS再度找到了用武之地。
  
      数据归档 CAS优势明显
  
      正是由于上述固定内容的增长和法律、法规的需求使得CAS技术焕发了青春。那么在SAN、NAS盛行,在磁带、磁盘已经成为存储主流的今天,CAS的优势体现在哪里呢?
  
      业内人士认为,CAS主要适合于存储固定内容数据,但CAS不会代替SAN、NAS,CAS和SAN、NAS是存储架构上的三驾马车,并驾齐驱。在设计一个企业级数据中心的时候,一定要考虑SAN、NAS和CAS三方面,才能从长远的角度来给客户提供一个整体的存储架构。如果只是考虑SAN肯定是有缺陷的,只是考虑NAS也是有缺陷的,只有三方面都考虑,才能从长远的角度把用户的数据在信息生命周期管理的架构下进行分类存放。
  
      对此EMC工程师黄斌告诉《中国电子报》记者,CAS和SAN、NAS在技术层面有一个最大的区别。SAN、NAS在存储文件的时候是按照地址存放文件,用户找文件的时候一定要知道它放在哪个磁盘分区的哪个目录里,否则就要搜索。而CAS没有分区、没有目录,用户不需要记住文件路径,只需要把数据交给CAS,CAS给用户一个数字指纹,相当于公民身份证,靠一串数字和字母组合的数字指纹来识别用户存储的数据。当用户需要找这个数据的时候,要提交数字指纹来获取数据,所以它的技术和传统的SAN、NAS是完全不同的。
  
      更重要的是,由于CAS存储数据方式的不同,导致跟NAS、SAN最大的不同点就是CAS的免维护性。这种免维护性,一方面减少了维护系统的人工成本开销,在NAS和SAN的情况下,一个管理员最多只能管理十几个TB的数据,而在CAS的情况下,一个管理员则能够轻松管理500TB的数据。另一方面,免维护性也增加了数据的安全性和可靠性,例如,在NAS和SAN中,管理员可能在维护过程中意外甚至有意地删除、修改数据,在CAS中,数据的修改是无法实现的,系统会根据最初数据存储的情况自动修复。
  
      此外,当用户的数据量越来越大的时候,其数据就一定要放在CAS,因为当用户的数据从1TB扩展到50TB的时候,SAN的性能会急剧下降,所以必须把固定内容数据、长期的具有历史保存价值的数据剥离出来,使SAN“瘦身”,让SAN的性能重新回到高效,使现有的存储达到更好的优化,NAS也是一样。
  
      由此可见,CAS的出现是对SAN和NAS的补充,唯有从SAN、NAS和CAS三方面来考虑存储,才是一个完整的存储架构。
  
      另外,SAN、NAS开始之前,原来我们的数据都放在光盘、磁带库里。但随之而来的最大的问题是维护量太大,驱动器非常容易坏,数据安全得不到保证。因为要通过介质读取数据,光盘要靠光驱,磁带要靠磁带机,如果这两个介质坏了数据就读取不了。唯有CAS技术能保证10年以后的数据还是好的,而这正是客户所需要的。另外,没有CAS之前,如果要保证磁带、光盘数据的安全性,每隔三年要把数据倒出来,做大量数据的迁移,如此大数据量的迁移,保证数据的安全是严峻的挑战。所以当用户需要数据恢复的时候,一定会选择CAS,而不会选择光盘、磁带。
  
      厂商追捧 标准是关键
  
      正是由于CAS上述的优势,使得许多主流的存储和主机厂商纷纷追捧。
  
      其实早在2002年,美国EMC公司就最早提出了针对固定内容存储需求的革命性存储技术??CAS技术,并推出了首款基于CAS技术的产品EMC Centera和系列平台软件,同时联手众多的应用开发伙伴,为客户提供全面的解决方案。目前,应用了EMC Centera产品的200多种解决方案已经广泛部署在全球4000多个客户的存储系统中,覆盖医疗、电信、金融、法律等诸多领域。
  
      在EMC推出Centera后,HP和IBM等厂商也陆续跟进,推出了它们基于CAS技术的产品,如HP StorageWorks RISS和IBM DR550和网格医疗归档解决方案(GMAS)。
  
      由于厂商众多,CAS技术标准化的工作也已提上议事日程。如今,SNIA(全球网络存储工业协会)已经联合EMC公司和Permabit,共同制定关于固定内容寻址存储解决方案的相关标准,即Content Addressable Storage Solutions Initiative(CASSI)。今后,CASSI还将作为SNIA的数据管理论坛和信息生命周期管理计划的一部分。
  
      此外,Byte and Switch(B&S)在最近的一份名为《内容寻址存储市场不断扩大》的报告中提到,目前针对于CAS的由SINA所制定的扩展访问方法(Extensible Access Method,XAM)存储接口标准正在讨论中。这份报告表示XAM可能会在今年年中的时候得到批准。