主存储系统中数据缩减的六大方法

主存储系统数据缩减功能正变得越来越流行了。产生这种现象的驱动力是可量化的成本节约,从不得不购买更少的磁盘来减少每年的支持费用,到减少存储管理相关的运营花费。

数据缩减在存储性能方面还有一个令人高兴的影响:通过减少不活跃数据对于昂贵的高性能存储的占用,使整个存储和应用系统的性能可以获得可喜的提升。 在典型的企业里,按照存储网络工业协会(SNIA)的研究,存放在主存储上80%的文件在最近30天内没有被访问;同一份报告还指出,不活跃数据的增长是 活跃数据的四倍。考虑到这些事实,数据缩减技术已经开始进入主存储领域就不觉得奇怪了。

然而,对比备份和归档系统所使用的数据缩减方法,主存储系统不能够容忍任何一点对于性能和可靠性的影响,这是主存储系统最相关的属性。因此,数据缩减技术发生了变化,并且在主存储上和用在备份和归档系统上采用了不同的方式。

在备份和归档系统上,重复数据删除和压缩是主要的数据缩减手段,而对于主存储系统,那些技术明显变得更加敏感,而且不会像重复数据删除和压缩一样影 响性能。这些主要的数据缩减技术正在被应用到主存储系统中:选择合适的RAID级别;自动精简配置;高效克隆;自动存储分层;重复数据删除;压缩。

主存储系统中数据缩减的方法:选择合适的RAID级别

把“选择合适的RAID级别”放在数据缩减技术列表的最前面首先看起来好像很奇怪,而且不像其它的数据缩减方法,这只是所有存储系统都可以使用的一 个选项,但它对于磁盘的需求、性能和可靠性都有着很大的影响。如果不考虑可靠性缺陷,RAID 0(跨所有磁盘的块级别条带,无校验或镜像)会是最划算和最高性能的选择,但单个磁盘故障将会丢失整个RAID组数据的缺点使其难登数据中心的大雅之堂。

另一方面,RAID 1(镜像,无校验或条带)和 RAID 10(条带化磁盘组镜像),结合了高性能和高可靠性,但需要两倍的磁盘容量,因此也是站在数据缩减的对立面的。RAID 5(块级别条带化,分布式校验)尽管需要一块额外的磁盘,但已成为近些年来最好的折衷方案了,但随着磁盘容量的增长,重建时间也越来越长,在单盘故障 后,RAID组重建的时候,丢失两块磁盘的风险已经增加到一个不舒服却不得不接受的水平。

因此,存储厂商们采用了RAID 6,通过对RAID 5增加一块额外的校验磁盘,使其能够经得起两次磁盘故障而不丢失数据–但随之而来的有不同程度的性能影响,这与实施情况有关。在购买一个新存储系统的时 候,RAID 6和RAID 6的性能指标都会是要考虑的事情。

“与我们大多数的竞争者不同,我们可以采用只有5%额外开销的RAID-DP(NetApp公司的RAID 6技术)技术,”NetApp公司的高级存储技术专家Larry Freeman表示。