DoSTOR专访:DataDomain让存储从磁带走向磁盘

    DoSTOR存储专访 8月10日北京消息:虽然目前已经有众多的企业意识到使用磁盘作为数据备份工具,而不是磁带的好处了,但绝大多数企业在备份数据时依旧是使用磁带进行,这当然有磁带自身的一些优势,但我们同时发现使用磁带备份时,数据并不是百分之百可以被恢复,也就是在备份与恢复这个过程中,原始数据会有损耗。根据ESG企业集团的一项调查表明,这个损耗率在20%。这个比例是相当惊人的,在当今,信息数据已经成为企业发展的核心力量,任何一点的数据损失,给企业带来的损失都是巨大的。在过去,由于磁带价格低廉容量大等等优点,使得企业不得不容忍这样一种损耗。
  
    磁带库的主要设计目标着重于备份,而不是恢复。正因为如此,现在一些公司正在把硬盘作为载体,使备份系统由磁带向磁盘方向转变。而硬盘技术的不断更新及换代,显然解决了使用磁盘成本高的问题。
  
    正是由于磁盘系统的迅速发展,使得D2D2T这样一种备份形式更为用户所接受。目前,D2D2T被众多生产制造虚拟带库的存储供应商应用,Data Domain公司就是其中之一。Data Domain公司是一家瞅准D2D2T市场的新晋厂商,其总部位于美国加利福尼亚州palo alto市。公司由greylock、new enterprise associates和sutter hill venture三人于2001年建立。它的主要产品是DD200/DD400系列,该公司称之为“容量优化磁盘恢复设备”。
  
    为了让更多的用户对存储未来的走向及磁盘存储相比磁盘存储的优势有所了解,DoSTOR特意对Data Domain公司首席技术官兼创始人之一李凯先生进行了专访,从他那里了解了一些最新的技术趋势以及Data Domain在磁盘存储设备上的发展。



Data Domain公司首席技术官兼创始人之一李凯


    DD200是2003年9月推出的,设备占4u机架,利用ATA磁盘存储容量达23TB。而今年第二极度推出的 DD400系列则是其最新产品,具有更好的性能,更大的容量和更好的可靠性。无论是DD200还是DD400系列都可以使用现有标准的备份软件将数据备份到设备上,最为关键的是它可以进行快速备份,这对数据信息量大的企业来说是非常重要的。它的主要特点是具有超强的压缩功能,平均压缩率可达20倍,且还有完整的备份数据可恢复性验证功能。同时它使用了标准的磁带压缩技术和称之为全局压缩的数据减少技术。这种压缩技术利用一个低于块级(sub-block-level)的增量变化方式存储到磁盘。这两种压缩类型相结合可以将容量减少20倍以上。20倍压缩率使1.2TB的可用物理容量可容纳大约23TB的压缩恢复数据。针对于备份数据的要异地保存的用户,可以在本地和异地各放一台Data Domain,Data Domain使用它的压缩技术将复制备份数据到异地所使用的网络带宽要求减到最少,且宣称每周复制带宽的需要可以减少96%。当然该设备还有其他的重要功能,例如不同地理位置之间的非同步复制。此外,Data Domain建议可以将它的产品主要作为备份服务器和磁带备份设备间的中转之用的现场存储设备,这就决定了数据存放时间约为6个月。
  
    DD系列产品可以配置成NFS文件系统,支持备份服务器对备份数据的存储(例如,在VERITAS NetBackup可配置成“磁盘存储单元”;在Legato NetWorker可配置成“文件系统设备”)。因此,它可以实现备份软件厂商提供的基于磁盘备份的的所有技术优势,并且提供几个月而不是几天的磁盘备份,一旦运转起来,它几乎不需要监管。和备份软件中删除无用备份的策略结合,RPM能够自动释放这些空间。此外,它的管理命令不超过15条。凭借其autoreport诊断功能,一旦出现问题,就会向管理员发出提醒。
  
    此外,数据是最宝贵的,一定要保证数据的可靠性。很多产品要卖到数据保护领域里的话肯定要说数据是可靠的。但是真正是否可靠很容易检验。因为数据存进去不一定和原来一样,即使做过硬件的校验也是在磁盘里,从磁盘到内存要经过很多东西,其中只要一个地方出错,数据就会和以前不一样,校验能保证数据的可靠性。所有的虚拟磁带库都不做校验。Data Domain的开发人员对可靠性非常重视,每次要做很细致的检验,除此之外数据每次都要做校验。
  
    用户可能会对,使用不同备份硬件所写出来的数据格式,产生疑问?如何确保即使不同的设备,原来备份的数据一样被读出呢?原来的用户有数据,通过备份软件备份到磁带,然后所有的格式都是磁带的格式。而在DD系列产品上,备份软件不用改变,原来的格式存到上面后就不是磁带的格式。而是备份数据写出来的格式。本来现在已经写出来时可以写到两个地方去,一个是磁带,一个是盘,现在已经有这个功能了。
  
    Data Domain的产品接受备份数据写出来的格式,接受格式以后再处理,处理后再传到盘上去。从备份软件来看不知道用户的数据是否被压缩,设备只会认为有一个很大的盘。得把数据往里放,再把数据拿出来。不同的备份软件不同,有的备份软件如果放到硬盘上的时候是这种格式,放到磁带上是另外一种格式。有些备份软件在磁带上的格式和在硬盘上的格式完全一样。DD系列产品对什么格式都无所谓,进行数据压缩和格式不发生关系。所以才能和所有的备份软件兼容。为什么有时和磁带上不一样呢?因为磁带不可靠,写一个大的数据块上去后,发现磁带有问题,需要再写一遍,用下一个磁带块。磁盘一般没有这个问题。格式需要做这个事。有些软件设计就不考虑这些问题,干脆把同样的格式写到磁盘里。事实上,Data Domain的产品在整个设备里被看作一块大的硬盘,文件备份进去与读取出来对用户来说,是没有变化,用户从备份窗口里看到的都是数据本身。