解答CDP部署过程中的十五大疑问

    无论存储用户、厂商还是业内分析家都认为,连续数据保护(CDP)是一个模糊的术语,而到底哪类用户需要使用CDP,使用的理由又是什么,则更加令人困惑。
  
   用户的担心包括:最初在CDP技术上的投资和在CDP之上管理业务的投入是否值得?将错误数据写入到CDP存储中的可能性?大部分CDP产品可以将数据恢复到程序上一次正确的状态,那CDP和简简单单做一次快照有什么区别呢?现在市场上所热炒的CDP和“准CDP”究竟有何区别?
  
    令人困惑的CDP
  
     对于大多数的中小企业用户,专家认为采用“准CDP”产品即可满足他们的要求。也许用户很难去了解它的工作原理,特别是准CDP产品和真正的CDP产品之间的区别其实并不明显,但真正的CDP产品被定义为拷贝每一个块并能够恢复到系统出问题之前的数秒或数毫微秒的状态,而目前的准CDP产品通常都只能做到分钟级别。
  
     总而言之,虽然最近两年CDP已经变成一个很平常的术语,但仍然有相当一部分用户仍然在努力理解这一技术以及市场上的相关产品。这一点在今年1月份在波士顿召开的一次存储世界会议上得到了印证。当主持人询问在场的60余用户代表,是否使用了真正的CDP或准CDP的产品时,只有一个人举起了手。而这位举手的用户所部属的CDP产品,也仅仅只是IBM的桌面级数据保护产品。尽管取样的数量似乎偏少,无法说明更多的问题,但从各大CDP厂商所得到的反馈也进一步证实了,用户对于CDP产品仍然持观望态度。
  
     以上所反应的虽然是国外用户的情况,但对于应用更为滞后的国内市场,CDP的应用状况更加不容乐观。
  
     选择CDP还是“准CDP”?
  
     有些用户似乎无法认同CDP的优势,他们似乎认为缩短备份时间真的没有什么必要。的确,对于部分行业的客户来说,对于缩小备份窗口的需求并非十分强烈。即使在卫生保健和法律专业的应用,间隔一小时的快照也足够了。
  
     正是在今年1月份波士顿召开的这次世界存储大会上,两个主要的使用方案显示出应用真正的CDP产品的显著优势。第一就是有多台服务器需要在同一时间使用快照进行备份的环境,第二就是那些追求零数据损失的环境。
  
     但是,除了以上两种特定的应用环境以外,剩下的应用是否也一定要采用真正的CDP产品呢?某些专家认为,无止境的追求零备份窗口,更多的是一种广告效应,对于大部分用户来说,使用准CDP产品、快照或者一些其他的基于磁盘的备份技术已经足够满足其备份需求。
  
     事实上,一些专家已经注意到,将给市场带来更多混乱的是EMC和Hitachi Data Systems Inc.(HDS)的一种叫做业务连续卷(BCVs)的技术,这是一种真正的分离镜像。但是常被厂商们看作是快照的一种。
  
     业务连续卷是卷的完全拷贝,而不是一个系统的虚拟重现。因此,真正的CDP和准CDP厂商关于快照占用的空间相对于真正的CDP和准CDP产品复制每个数据块所占用的空间将是今后技术进步的牺牲品。一个完全快照或者在一个繁忙环境中业务连续卷的递增会比完全连续备份消耗更多的磁盘空间。业务连续卷技术在这样的环境中找到了用武之地,真正的CDP产品可以更胜一筹。
  
     真正的CDP技术应用在需要经常进行快照的不同种类的大型环境管理中也相对简单。例如用户有在多台不同的服务器上的多个不同的应用,而需要使这些应用休眠,并在用一时间对它们进行快照,CDP技术相比传统的快照技术将更有优势。
  
     像银行或者网上零售商的应用,每一秒钟对大型的数据库的处理量可能是成百上千甚至是数百万计的,而一笔交易的丢失都可能会给生意带来严重影响,对于这些用户,真正的CDP技术是避免问题出现的选择。数据库本身带有工具,比如Oracle的Recovery Manager,在技术上提供自身的处理级的恢复,然而,这些应用程序通常把最近的业务保存在联机重做日志里,而这种日志如果没有加载的话是不会被复制的,也就意味着交易的数据可能在系统遇到问题时会丢失。
  
     随着立法越来越严格,真正的CDP产品作为一项法规遵从方面的工具也越来越有吸引力,因为真正的CDP技术会记录和保留应用程序中每一个块上的每一点改变,修改时间和修改的内容都可以显示出来。
  
     但这一切的前提都需要CDP产品获得更广泛的认可与应用,而关键则在于CDP的产品一定要和传统的备份产品以及其他应用程序更好地整合在一起。
  
     也许某些用户感受不到CDP与传统备份的不同之处,但它们的确和我们目前备份的方式完全不同。传统的备份程序无法像控制其他类似于虚拟磁带库这样的基于磁盘的备份产品一样来控制CDP。对于用户来说,可以在一秒钟之内备份一切是个好主意,但是如果用户想保持现有的架构,除了CDP之外,还需要运行传统的备份程序。那么作为用户来讲,无疑会认为这样的备份过程过于繁琐和复杂。
  
    关于具体应用的疑问
  
     连续数据保护(CDP)软件是一项相对较新派的备份技术,当然所有的技术都会有其优缺点存在。下面是存储分析家Jerome Wendt在一次最近网上的交流中指出的困扰存储管理者的一些关于CDP的问题。
  
     CDP是否能够应用在系统卷上?
  
     Jerome Wendt:不同的CDP产品是不同的,一般经验是,网络CDP产品是卷-未知和数据-未知的,这样一来采用Revivio Continuous这类产品来处理系统卷就变得安全了。前提是系统卷是镜像卷的一部分,而Revivio 的逻辑单元号(LUN)是这个镜像集合的一部分。本地主机产品则需要逐个考虑了,但是,不管是Mendocino Software公司的Realtime还是Storactive公司的LiveBackup都是本地主机CDP产品,它们只支持Windows上的系统卷,而不支持Unix操作系统。
  
     何时I/O写操作完成?
  
     Wendt:这取决于该过程是带内的还是带外的,还取决于写操作是同步的还是异步的。
  
     对于那些本地主机产品,写操作确认是在对第二组存储设备(CDP管理服务器)进行写操作时才发生。对于网络CDP产品,写操作确认信息是从主存储设备和CDP设备返回的。I/O完成的状态问题与性能、同步镜像有关,而且还要考虑是否有数据丢失。网络CDP应用处理速度正逐渐趋向于主存储的处理速度,因为在大部分CDP应用上,写操作在写入磁盘之前都被写入了高速缓存。Storactive和Mendocino是本地主机CDP解决方案,是在异步模式下运行的,强调的是性能优势,而不是对数据损失的处理。至于数据损失,即使是遇到系统故障的情况下,不管是网络CDP应用还是本地主机CDP代理通信的管理应用,在主存储设备都上没有任何数据损失。
  
     CDP是否允许对内存中的块在写入存储介质之前多次进行更新?
  
     Wendt:网络CDP提供商Revivio开发了一种特定的新算法来减少物理读写来应对这种情况。本地主机CDP供应商利用缓冲写操作的方法来延迟写入。
  
     CDP是否支持连续(亲和)组?
  
     Wendt:大部分第二代网络或本地主机CDP产品都支持,但可能没有使用这个名字。Mendocino把它们称作“context”并定义为保持了真实写顺序的逻辑分区。Revivio则把它们叫做“亲和组”,并使用这个术语来描述一组从同一个时间点的数据上重建的LUNs。
  
     在本地主机CDP中,做数据离线复制,CDP是否需要整个系统离线操作或者它能否在复制的同时继续工作?
  
     Wendt:最近的一些案例中,CDP产品可以在复制的同时继续工作。Mendocino Software公司可以在通过IP网络异步复制数据到远程主机的同时对受保护的服务器进行数据收集。
  
     CDP如何在高峰负载时管理流量控制?
  
     Wendt:本地主机CDP产品允许CDP发送写操作进入备份队列,还可以不中断地进入本地存储队列,现在他们还不能响应长时间的密集读写操作。而且如果本地存储过程中资源耗尽,CDP就会停止工作。Revivio保证允许在读写高峰时对用户提供尽可能多的CDP资源,同时还为管理员提供了足够的灵活性来扩展响应密集读写的能力。还可以利用QoS确保资源被优先用来处理写操作。
  
     什么是“侧文件”?是否只是一个暂停处理过程的工具来允许文件备份,LUNs到磁带等介质并开始重新同步?
  
     Wendt:“侧文件”在不同的CDP厂商处有着不同的名字。Revivio公司的是TimeImages,而Mendocino Software则认为就是简单的快照。不管CDP厂商如何来命名,大部分都是支持这一功能的,并把其作为一项主要的附加值。用Mendocino来做快照允许管理员把快照通知另外一台服务器。当把快照通知给了另外一台服务器,受保护的服务器就无法连接这个快照,其他服务器也不能通过管理程序来访问这个快照。通过这些快照,就可以运行备份而不影响受保护服务器上的数据。这个功能在不同的CDP产品上也不完全一样。举例来说,Storactive公司的Liveserv,当暂停处理过程时,它会中断CDP并强制在重新启动系统后进行重新同步,这是由于现存的Liveserv和Exchange之间的紧耦合决定的。
  
     在多服务器存储子系统中,是如何来同步时间,保证更新的顺序正确?
  
     Wendt:Revivio发现本地主机CDP解决方案不能解决跨服务器的CDP服务器之间的时间同步问题。Revivio相信同步问题只能通过网络CDP来解决。网络CDP可以在所有提供存储的服务器上管理时间达到微秒级,这就可以让你在多台服务器上运行一组应用程序。不管Revivio如何表示,Mendocino Software公司可以支持本地主机的Realtime CDP解决方案。
  
     如果很多数据通过IP网络发送,就意味着在IO繁重的系统中,这将成为一个瓶颈,对么?
  
     Wendt:根据选择的不同产品,这个说法可能是对的。本地主机CDP产品,例如Storactive的LiveBackup,依赖一种假设,就是IO操作是离散的,不影响性能。Mendocino Software发现当写入主存储器,并且CDP管理服务器正在同步应用程序的时候,系统会变慢,因为所有的写操作都必须返回完成信号给受保护的服务器。第二代本地主机CDP产品,例如来自Topio和Revivio的产品,在传输到中央服务器之前,会将写操作缓存到本地磁盘,来最小化双向写操作带来的性能损失。
  
     在每台生产主机安装CDP代理程序会带来什么额外开销?
  
     Wendt:大多出这个领域的厂商都报告说大约有2-3%的额外开销。事实上,以读为主的应用比以写为主的应用有更少的开销。
  
     CDP是否支持Netware 6.5 文件服务器?
  
     Wendt:我还没有发现支持Netware 6.5的本地主机CDP产品。理论上说,第二代网络CDP产品可以用于连接在SAN的Novell服务器上。Novell 6.5提供的存储服务可以创建软件镜像(RAID-1)。通过在CDP产品上展现LUN以及同样大小或者更小的LUN的镜像给Novell文件服务器,你就可以实现这个目标。网络CDP产品,例如Alacritus Software公司的Chronospan和Revivio的Continuous能够应用在这种配置中。Revivio报告他们的CPS-1200是一个块节点设备,而且不受操作系统限制。这两个公司都不关心他们的客户是否把他们的技术应用在了Novell 6.5之上。然而,这两家公司也有客户正在把他们的产品和无数的老技术,例如MUMPS,Pick和Informix相结合。
  
     如果我的管理服务器用Tivoli Storage Management软件来做备份,在恢复其他服务器之前,或者启动灾难恢复之前,管理服务器是否要完全恢复呢?
  
     Wendt:简而言之,是的。我建议只用TSM保护系统和应用程序文件,而不是数据存储本身。因为数据存储是由CDP应用产生的,存储会经常变化,而且依赖TSM会让你暴露在灾难之中。你应该建立第二组CDP服务器,离线工作,异步复制CDP数据。通过这种方法,你可以先用TSM恢复CDP服务器的操作系统和应用程序,然后用第二组CDP服务器来恢复数据。
  
     CDP的这些优点和缺陷是否在所有的环境和平台上都是如此?包括大型机吗?
  
     Wendt:是的,CDP的优点在所有的环境上都是相同的,我还没有发现任何支持大型机的CDP产品。
  
     第二代的CDP产品是否能支持单一文件的时间点复原?
  
     Wendt:是的,可以。像Mendocino Software公司推出的第二代本地主机CDP产品Realtime就是基于文件系统的,它就支持了这项功能。XOsoft公司的Enterprise Data Rewinder和Storactive公司的LiveBackup都是第一代本地主机CDP产品,也支持了这种功能。