爱数一体化容灾技术——重复数据删除
爱数 发表于:12年06月20日 10:30 [来稿] DOIT.com.cn
相信许多人都听过这样一个故事:舍罕王打算奖赏国际象棋的发明人——宰相西萨.班.达伊尔。国王问他想要什么,他对国王说:“陛下,请你在棋盘的第1个小格里,赏给我一粒麦子,在第2个小格里给2粒,第3个小格给4粒,以后每一小格都比前一小格加一倍,直到摆满全部的64格。您就把这些麦子赏给我吧!”国王觉得这要求太容易满足了,就命令给他这些麦粒。但是当人们搬来一袋一袋的麦子开始计数时,国王才发现:就是把全国甚至全世界的麦粒全拿来,也满足不了那位宰相的要求。事实上,人们估计,全世界两千年内生产的全部麦子可能也没有那么多!
笔者之所以想到这个故事,是认为故事里的情景和大数据时代颇有相似之处——当世界上第一台计算机诞生,从此信息和数据从纸张记录、人工计算演化到电子记录、机器计算时,就好像故事里棋盘上麦粒刚刚被摆放了两三格。人们此时的观点和国王是一样的:即使摆满了棋盘,麦子也不会有多少。但是渐渐地,人们发现棋盘上麦子的数量要远远超过预期,全世界的数据竟然会达到这样一种规模——据IDC预计,到2020年,全球数据使用量预计暴增44倍,达到35.2ZB。全球大概需要376亿个1TB硬盘来存储数据。
大数据时代企业备份容灾面临的压力
也许有人认为这只是一个全球性的大背景,具体到企业或者个人上,大数据也许没有那样明显的体现。然而,事实真的是这样吗?
就个人来说,相信大家都有这样的经历:电脑明明已经有了几百G的硬盘,然而却总是嫌空间不够,需要在精挑细选下载的电影、电视、游戏、资料中再精挑细选一遍,忍痛删除一些,然后放入新的数据。
就企业来说,也许前几年CIO们的重点还在如何挑选服务器上,在性能、价格上面反复考量。但是渐渐地,问题似乎不再是如何选择服务器,而是如何应对数据的爆炸式增长,如何规划存储,如何保护数据。
数据是企业最为宝贵的财产,备份是最为常见的保护数据的方法。然而前面已经说到,数据的增长已经为企业的存储带来了极大的压力,更何况要不断地把这些数据备份……笔者不禁在头脑中再次浮现出开篇故事的场景:棋盘里不断成倍增长的麦子。
在这样的背景下,重复数据删除技术的出现就毫不奇怪了。其实,早在“大数据”这一概念被提出来之前,重复数据删除技术就已经存在。因为在那个时候,数据也需要备份,重复数据也存在。但是到了大数据时代,重复数据删除技术的价值则显得更为宝贵。从最初的被怀疑、到价值彰显,直到现在,重复数据删除技术已经成为大数据时代企业IT系统的必配技术。在今天,企业面对重复数据删除技术,所考虑的问题已经不是要不要使用该技术,而是要结合自身IT系统的当前情况以及未来规划去思考如何挑选不同的重删产品,如何部署重复数据删除解决方案。