专家博客 主存储去重对归档备份造成威胁?

在我们开始测试存储重复数据删除技术的时候,我们发现这种技术所带来的延迟性对于许多数据中心和应用程序来说可能很快就不是问题了。

也许很快这种技术的延迟性对所有数据中心和应用程序都不成问题。如果你从性能的角度在主存储上使用重复数据删除,那么主存储对其他存储层又会带来什么影响?

主存储重复数据删除是否会敲响归档和备份的丧钟?

想象一下,在不很远的将来,你购买了一个存储解决方案,它有几个机架的固态存储,几个机架的1.5万转SAS驱动器和许多个机架的SATA存储。

所有的存储都由一个在存储控制器上运行或跨节点运行的存储管理软件来控制。数据的重复数据删除方式可能是在线式的,可能是后处理方式的,数据可能被也可能不被压缩。

结果是100TB的存储系统现在可能可以存储10PB的实际数据,而且只有一小部分数据存放在固态驱动器上或SAS层上。这是因为存储系统会跟据数据年龄或用户自定义的自动分层参数自动地将数据在存储层之间迁移。

这样的做法可以带来高性能而且控制了成本。

这种类型存储系统对归档和备份系统的影响是很大的。我认为特别是归档有可能退出舞台。我不能说归档这个流程会消失,而是指作为独立存储系统的归档会消失。如果我可以在一个系统上存10PB的数据,那么为什么我不这么做呢?

无论磁盘归档多便宜,我还是需要主存储。如果归档可以放在SATA存储上,那么除非厂商要价太离谱,否则我会考虑这种方式。

备份的存在也面临危险。

多数主存储供应商声称提供无限的或大量的快照,因此可以及时恢复。

即使不是全部,大部分存储供应商可以将数据复制到二级站点,因此主系统甚至主站点的故障也不会导致数据丢失。

唯一的顾虑是元数据处理是否出错。如果处理出错或快照达到5PB,那么系统会当机。这种情况确实有可能发生。

某种程度上说,你会希望将数据放在其他平台上以防备这种情况。

我不认为主存储供应商在这上面做得很好。如果主存储要成为归档或至少短期备份,那么供应商必须提供数据保留功能,改善扩展性,最终在保护机制上摆脱对独立磁盘冗余阵列的依赖(至少在SATA存储上)。

我认为归档供应商在近期内仍然可以扮演重要角色,而备份系统供应商还可以坚持更长时间。现在的情况是主存储供应商希望提供全能的单一系统,这是有可能实现的。

现在我们感兴趣的是有哪家供应商可以在整个堆栈中整合重复数据删除功能,从备份一直到数据集的复制副本。

我想,包括我自己在内的很多用户都希望还能有一个数据集放在不依赖于原始存储系统的另一个不同的存储媒介上。

这种类型的存储系统另一方面也会对传统双控制器架构产生影响。