从存储开始 七招教你构建绿色数据中心
李隽 发表于:11年02月06日 00:00 [转载] IT168
重复数据删除:给数据瘦身
由于磁盘技术近年来的快速发展,一些企业和用户越来越倾向于采用磁盘进行备份或者归档,由此带来的能耗问题也是突出的。传统的备份策略往往会在用户的磁盘空间里面产生大量的冗余数据,由此消耗了大量不必要的磁盘空间,带来一系列的能耗和冷却的问题。有什么办法能够消除掉这些多余的数据,从而避免不必要的能源消耗呢?
重复数据删除技术会深入到组成文件的数据块,分析文件由哪些数据块组成,并删除相同的数据块,只保留单一的副本。就像不同的房子可能都是由相同的木材、砖头、水泥等组成,不同的文件经过拆分后,也会出现很多的重复数据块,删除这些重复的数据块,就能大幅度缩减缩需要的存储空间
重复数据删除最大的优势在于节约用户数据存储所需要的存储空间,因而能够节约数据存储所需要的能源损耗。基于磁盘的备份归档方案与传统磁带库相比在性能、稳定性方面都有很多优势,但是一个突出的不足之处就是,磁盘介质是在线存储,需要一定的能耗,而磁带则是离线存储,本身不需要耗能。
重复数据删除能够大大减少数据存储与备份所需要的空间,因而减少存储与备份的能耗。大家知道厂商宣称的重复数据删除比根据不同的数据能够达到1:30或者1:20,无论对存储空间的节约方面和能耗节省方面都是有着突出意义的。
一般人往往容易混淆重复数据删除与数据压缩的概念,二者看起来的确有一些相似之处。但实际上,数据压缩技术通过对数据重新编码来降低其冗余度(redundancy);而重复数据删除技术则着眼于删除重复出现的数据块。前者属于文件级别,后者根据不同厂商的技术特点,既可以是文件级别的,也可以是数据块级别的。
尽管关于重复数据删除的实现方式,业内还存在“预处理模式”和“后处理模式”的纷争,不过重复数据删除在节约空间方面的显著效益已经使其成为企业采购备份设备时所必须考虑的因素之一。
重复数据删除可以在数据写入到存储目标前进行操作,称为预处理(Preprocessing)或在线处理(Inline);也可以在数据存储到目标设备后进行操作,称为后处理(Postprocessing)。如果希望数据快速备份,更关注缩小备份窗口,那么,后处理方案比较合适;但如果你“有的是时间”,又需要节省备份磁盘,降低成本,则不妨考虑预处理方案。
自动精简配置:按需分配
除了重复数据删除、数据压缩等等的技术能够通过减少数据容量减少磁盘数量,从而进一步减少能耗,存储领域还有一些其他的新兴技术,尽管并不能够减少数据量,但是也同样能够减少系统所需要配备的磁盘数量,起到节省能耗的作用。自动精简配置就是其中之一。
自动精简配置是从去年开始进入我们视野的,简单来说,自动精简配置就是一种容量分配计划的优化技术。在传统的存储系统中,当服务器端的某项应用需要一部分存储空间的时候,往往是预先从后端存储系统中划分出一部分足够大的空间预先分配给该项应用,即使这项应用暂时不需要使用这么大的存储空间,这部分存储空间也已经被预留了出来,无法给其他的应用提供存储空间。这就在系统中造成了无法利用的存储空间,不仅仅浪费了大量的采购成本,还产生了不必要的能耗。
采用自动精简配置的系统则不会一次性的划分过大的空间给某项应用,而是根据该项应用实际所需要的容量,多次的少量的分配给应用程序,具体的分配方式每个厂商有不同的特点,但是都保证了每个应用程序不会一次性的占用过多的存储空间。当该项应用程序所产生的数据增长,分配的容量空间已不够的时候,系统会再次从后端存储池中补充分配一部分存储空间。
自动精简配置听起来很简单,但是我们却不能小看这种容量分配方式的改进。原因在于,在自动精简配置出现以前,我们往往习惯于预测过多的容量空间分配给应用程序,这样每个应用程序都占用了过多的存储空间,导致整个存储系统的容量利用率变得非常低,很快我们就需要采购新的存储空间,而我们在采购的时候也同样习惯于预先采购大量的多余的存储空间以作备用,这种应用模式带来采购成本上、能源上很多不必要的浪费,也增加了管理的复杂程度。
另外,一些厂商的自动精简配置的实现方式是通过虚拟化从存储资源池分配存储资源到逻辑卷,所以比传统方法,往往可能有更多的物理磁盘来支持每个逻辑卷。这将减少输入输出列队次数,而且也将减少某一个“热点”在同一块磁盘发生过多次的可能性,多块磁盘替代一块磁盘完成了以往的任务,性能比传统方法也有显著的提升。
在“绿色存储”蔚为潮流的今天,自动精简配置也受到了越来越多的追捧。数据中心的能耗问题直接与磁盘相关,而自动精简配置能够帮助用户在不降低性能的情况下,减少磁盘购买数量,从而降低系统的整体能耗、冷却成本、以及二氧化碳排放量,因而也具有不可忽视的绿色意义。如今,自动精简配置已经成为“绿色存储”概念下的一个重要的关键词。
目前各个厂商的存储精简技术都可以减少存储磁盘的容量需求,容量大约有60%的缩减。也就是说,60%的能源和二氧化碳排放能够通过自动精简配置技术被裁掉。因为用户对于未来磁盘的需求数量降低了很多,而全球磁盘价格自然也是不断走低,这样当然也就大幅削减了资本开销。而且由于磁盘空间的减少,相应的电力成本、制冷成本、空间成本都相应缩减。
总的来说,使用自动精简配置后的磁盘需求削减,确实很大程度上缩减了TCO。减少的TCO意味着延迟未来的添加磁盘的需求。但如同虚拟化、重复数据删除等等新兴的技术一样,任何一项技术从诞生到逐步完善再到在应用中普及都还需要一定的过程,就这项技术而言,目前成功的应用案例尚不十分普遍,用户在决定部署时多少需要担一些“第一个吃螃蟹”的风险。但毫无疑问,自动精简配置是存储未来的发展方向,并且逐步成为存储系统的必备的主流配置。