DoSTOR存储分析 揭秘NetApp重复数据删除技术

    DoSTOR存储分析 3月22日消息:从NetApp本周公布的一份白皮书来看,该公司已经在自己的产品中添加了重复数据删除功能,不过只支持NetApp的三款产品,而且只能对有限的数据进行重复删除。
  
    NetApp采用了单一实例运算法则,将其重复数据删除技术称作先进单一实例存储(Advanced Single Instance Storage,A-SIS)。



    据这份白皮书介绍,A-SIS只在灵活卷(Flexible Volume)中存储唯一的数据块,在这个过程中,会产生少量的元数据。每个数据块都有一个数字签名(digital signature),这个数字签名可以与灵活卷中的其他签名作比较。如果某个数据块的数字签名在这个灵活卷中有一个相同的可匹配的数字签名,那么这个重复的数据块就被删除了,这样,磁盘空间就被重新释放了。
  
    这份白皮书还声称后处理(Post-Process)重复数据删除对写入的性能只有1%的影响。后台进程(Background Process)是通过一个命令行界面(command-line interface,CLI)来激活,可以预先设定或手工操作。A-SIS是在灵活卷的活动文件系统(active file system,AFS)上来操作。
  
    目前具有这项功能的产品还在测试过程中,还没有发布。白皮书中介绍了在NearStore上部署A-SIS的说明,但是还需要两个许可才能激活,这两个许可称作”nearstore_asis2″ 和”nearstore_option”。
  
    任何与快照副本有关的数据块都不能被执行重复数据删除。A-SIS只能够作用于通过CIFS或NFS发送的数据,不能作用于逻辑单元号(LUN),而且目前只适用于NearStore R200、FAS3020c和FAS3050c。A-SIS只能在灵活卷上执行重复数据删除,不能在非灵活卷上执行, NearStore R200、FAS3020c和FAS3050c上分别只有4TB,2TB,和1TB的灵活卷。
  
    这份白皮书还建议用户“不要过渡频繁地运行A-SIS…不要同时运行八个A-SIS处理过程,因为这会对其他的应用性能产生负面影响。”
  
    这份白皮书接着说:“由于上述原因,最好的做法是取消灵活卷中任何A-SIS预先设定,而是手工来操作A-SIS,关闭预先设定的快照副本或者保持快照副本在一个最小值…如果需要快照副本,就要在创建快照副本之前运行A-SIS,因为这将使锁定在快照副本中的数据达到最小值。”
  
    DCIG总裁兼首席分析师Jerome Wendt表示:“这看上去很像一个中小企业类型的解决方案,当备份窗口结束了之后,你有大量的时间来对已经备份的数据做重复删除。在一天中你可能会释放磁盘空间,但是在执行重复数据删除之前,你还是需要为你的备份留出所有的空间。就我看来,这像是一个穷人采用的单一实例存储解决方案。它会发挥作用,但是实在不适用于大企业。”