本文作者Joe Hernick
没有存储空间了?没有预算了?我理解你的感受,朋友。我们中的大部分人在实际生活中都在艰难地寻求如何装下我们所有的东西。许多人几乎一半的时间都是在整理,比如丢弃不需要的东西,剔选需要保留的东西(十个以前的泰迪熊–老公要保留一个儿时纪念品……并在旧货市场上把以前搜集的带扣出售掉…..老婆要保留具有纪念意义的带扣…….)所有这些都可以归结为在有限的预算约束下更有效地利用已有的空间。
你的数据存储容量预测是怎样的?你后面四个季度的预算是怎样的?如果你和我们大部分人一样,那么你既缺少磁盘也缺少预算。我还将列一个清单,上面列出的那些推动因素促使你的存储增长趋势高于你在两年前所作出的三年规划。内部保留、DR(灾难恢复)/BCP(业务连续性计划)政策、有限生产窗口下所必须的D2D(磁盘到磁盘)备份、针对远程用户的集中式备份、多站点远程复制、外部推动的保留合规要求等。这还只是你存储金字塔的底部。你如何装下这些备份和归档数据?
在你的数据集中装了多少个同样的"泰迪熊"?重复数据删除技术可以让你只保留一个"泰迪熊"并清除那些副本。不同的重复数据删除功能可以从各个角度分析你的数据,从比特层次一直到块层次和文件层次。分析精度影响到速度和压缩比率。最近InformationWeek Analytics调查了437位IT专业人员,并发现有意思的结果:超过一半的人要么已经在使用重复数据删除技术,要么正在测试评估该技术。在这些人中,34%的人取得了10:1到20:1的数据缩减结果;20%的人取得了20:1到50:1的数据缩减结果;4%的人取得了50:1以上的数据缩减结果。这意味着有很多重复的文件或块或数据比特被剔除掉。所有厂商都异口同声地提示说数据缩减结果将取决于用户的内容情况和当前的备份策略。
这项调查还得出了一项出人意料的结果:在这些部署了重复数据删除系统的人中,81%的人要么在一级存储上实施该技术,要么在一级和二级存储上实施该技术。你可以想想在你的SAN(存储局域网)上的所有VM(虚拟机),并想想在这些虚拟服务器或VDI(虚拟桌面架构)客户端上的所有同样的系统文件。
你还徘徊在重复数据删除之外吗?你可以看看EMC和NetApp为了收购Data Domain所发起的收购战。最终EMC以21亿美元的现金购得Data Domain。重复数据删除很热门。一位存储经理告诉我–任何人都可以构建一个比企业级重复数据删除设备更便宜的"极其廉价的SATA阵列"。是的,磁盘现在可以很便宜。但是重复数据删除可以帮你解决存储中的重复数据。你可以为了同一个数据的多个副本而不断购买阵列,你也可以开始清理你的存储。至于那些还没有部署重复数据删除的被调查者,当被问到为什么还未采用重复数据删除的时候,37%的人只是因为还不熟悉该技术。只有19%的人说是因为成本上的原因。在已经部署重复数据删除的人当中,超过一半的人认为可以在一年内收回投资。