DoSTOR专家观点 软件发展是绿色存储技术的关键

DoSTOR专家观点:本文作者为业内著名咨询顾问和分析师Christine Taylor,他目前是分析机构Taneja Group的分析师,最近的研究领域集中在绿色数据中心领域内,并撰写了大量主题文章。

现在,整个业界到处都在讲绿色发展,IT行业中的各个领域的厂商都争先恐后地加入到这个阵营中来,并且声称它们以及它们的产品都是环保的。绿色包装、绿色工厂、绿色磁盘驱动器、绿色阵列、绿色交换机等等,不一而足。

当然,能耗确实是一个很现实的问题,因为数据中心的能源成本正在不断飙升。这为整个IT行业的服务器、存储设备、网络和各种设施都提出了更高的要求和挑战。随着企业们使用更多的能源来保持照明以及设备运转,它们的能源预算也不断攀升。这是一个很大的问题,绿色数据中心运动的目标就是在生产规模不变的情况下控制能耗支出。

目前还没有一种合适的方案可以解决这个问题。但是,企业们正采取各种综合性措施来控制能耗。首先,可以利用各种软件技术来优化存储容量和压缩存储的数据。除了基于软件的解决方案之外,使用可持续低能耗的数据中心还可以利用SLA方法来管理能源使用,设计高生产效能和高冷却效能的生产厂以及完善硬件的能效。

绿色计划的核心是通过减少数据量来减少所需的能源的理念。这是一个不显示的说法,因为如果不牺牲价值的话,缩小数据量就是无法做到的。然而,你可以利用创新的软件技术来努力实现这个目标。要开一个好头,需要些什么呢?即便是不采用能源SLA、绿色设施设计以及硬件方面的改进等方案,单纯将存储数据量减少的话,也可以在不牺牲价值的前提下节省50%甚至更多的能源。如果加上前面所说的三种解决方案,你最多可以节省下80%的能源。

存储系统的容量必然会随着时间的推移而不断增加。然而,能耗和冷却成本却是随着容量的增加而增加的,这样能源成本就必然会增加到一个无法让人接受的水平,数据中心也将最终达到其扩展的极限。仅仅是增加存储容量是不行的,我们还必须优化现有存储系统的可用容量。仅这一点就可以通过减少数据量而控制住与存储设备有关的能耗问题。

可以降低能耗的软件技术包括重复数据删除、自动精简配置、原始数据压缩以及虚拟化等。此外,不管在软件还是硬件上,都还有其他一些可以节能的技术。我们将在以后的文章中介绍那些节能技术。

重复数据删除

重复数据删除是优化存储容量的关键技术,特别是对于那些基于文件的NAS应用数据以及虚拟磁带库数据更是如此。因为它可以极大地优化存储系统,减少数据量,从而降低能耗以及减少产生的热量,因此它是一种绿色技术。

重复数据删除可以大幅减少存储数据量和相应的能耗。然而,不同的厂商推出的重复数据删除技术也是不同的。例如,有的厂商只开发文件级重复数据删除技术,但是其他厂商则将重点放在更低级别或者更高级别的重复数据删除技术的开发上。

不同厂商的不同技术最根本的区别在对重复数据删除技术应用的最佳位置的选择上,可以是开始备份数据时即完成的服务级重复数据删除,也可以是服务器与存储设备之间的Inline方式或者备份完成之后的post-processing方式。

第一种方式的代表厂商包括EMC公司和赛门铁克公司,这是显而易见的,因为重复数据删除技术可以令它们的备份应用软件增值。Inline方式的代表厂商包括DataDomain公司和Diligent公司,post-processing方式代表厂商则包括Sepaton公司和FalconStor公司。Quantum公司则开发出了一种混合型应用软件,可同时提供Inline方式和post-processing 的重复数据删除技术。

不管你选用哪种重复数据删除技术,节省的容量都是惊人的。集成了重复数据删除技术的备份系统可以将备份数据量平均减少到以前的二十五分之一,当然,由于具体情况的不同,重复数据删除技术的数据精简率也是不同的。

自动精简配置

自动精简配置是基本模块存储设备的另一个节能方法,因为它可以让IT系统为应用软件分配比其物理存储空间更多的存储空间。这是解决预备存储容量不足问题的最佳解决方案。

在数据中心,用户和应用软件要求的存储容量通常会比应用软件在中短期内实际使用的存储容量更多的容量。这在企业预算制定过程中以及为特定应用软件提供足够存储容量的要求时是合理的。然而,这种过度要求存储容量的通常结果是一再提高过度预备的程度,而利用率却不断降低,直到20%甚至更低的水平。与此同时,80%的有效存储容量却只是为了消耗能源和冷却资源而存在在数据中心里。

这也正是自动精简配置技术被开发出来的原因。利用自动精简配置技术,可以为应用软件分配比实际容量更多的虚拟存储容量。例如,管理员也许可以为一款应用软件分配100GB的存储容量,而实际系统中配置的存储容量只有10GB。随着存储容量要求的增长,自动精简配置技术可以自动释放更多的物理存储容量。可以设置容量预警功能以便在达到存储容量极限的时候自动添加更多的存储容量。这样就可以降低存储容量资源的过度准备率,提高磁盘利用率并极大降低能源成本。

当然,整个过程并没有那么简单。例如,有些应用软件会用元数据自动标记所有已分配的磁盘空间,并通过这么做来提高性能,这样的话,不管怎么做那些应用软件也会占用很多存储容量资源。不管如何,对于降低资源过度配置率和相关能源成本来说,自动精简配置技术的成本效率都是很高的。

数据压缩

除了重复数据删除和自动精简配置之外,原始数据压缩和存储虚拟化技术都可以降低系统对能源和冷却的要求。这两种技术都不是什么新技术,但是在降低数据中心成本的角度上来说,它们都还不太成熟。

非生产环境下的数据压缩技术已经出现了一段时间了。压缩数据可以节省磁盘空间,加快利用备份资源恢复数据的速度,并节省下购买更多存储系统和媒体的成本。在二级存储设备中,压缩数据可以减少使用的磁盘数量从而减少磁盘运作所消耗的能源成本。然而,几乎没有一家企业在一级生产环境中使用数据压缩技术,因为对数据进行压缩和解压与系统所要求的高性能是相悖的。

但是随着企业们对高能效数据中心的兴趣越来越浓厚,厂商们开始将注意力转移到高能源成本的一级存储设备上。大部分的重复数据删除和数据压缩都应用于二级存储上,这也就意味着能源主要是被一级存储设备消耗的。因此,根据一级存储设备而优化的数据压缩技术已经成本绿色数据中心里的另一项创新软件技术。象Storwize公司等厂商开发出来的原始数据压缩技术是不会影响系统性能的。压缩后的一级存储容量可以降低对二级存储容量和复制带宽的要求。

虚拟化

存储虚拟化是绿色数据中心的另一项关键技术。创建绿色数据中心时遇到的最复杂的问题之一便是为大量存储设备提供能源,那些存储设备每一台都要求有其自己的能源,而且都会发热。虚拟化技术可以利用不同设备的容量来建立一个虚拟化存储容量池,然后解决各个设备的数据存储问题。

存储虚拟化还包括许多管理大型虚拟存储池的最优方法,比如增加多磁盘之间的带宽来提高性能。应用虚拟化技术的成果就是有效利用物理存储容量,改善存储容量配置,以及减少能源和冷却成本。

对于企业来说,建设高成本效率和持续稳定的绿色数据中心是一项重要的事务。然而,减少与能源有关的成本和管理数据中心内的设置却是灵活性很高的一项事务。存储设备的能耗在整个数据中心能耗中占了很大一部分,利用创新软件技术降低存储设备的能耗可以对企业减少能源开支起到立杆见影的成效。企业们利用这些软件技术建立绿色数据中心,就可以明显减少与存储设备有关的能源成本。然后它们还可以再结合使用其他策略,包括利用SLA来管理能源使用、建立高能源效率的基础结构以及将硬件设备的能效提高到最大极限。

关于绿色数据中心的调查

根据一项关于最终用户的调查结果显示,将近有四分之三的用户对采纳绿色中心计划感兴趣,然而,只有七分之一的用户成功地做到那一点。这项研究中界定的绿色数据中心的含义是指数据中心提高了能源使用的效率、功耗效率、空间利用率以及减少了对能源的污染。

ZiffDavisEnterprise公司受赛门铁克公司委托进行的这项调查总共咨询了14个国家的800多名数据中心经理,其中大部分数据中心经理都就职于全球2000强企业和其他大型企业。

在美国,大约只有三分之一的企业采用了绿色政策,而亚太及日本地区和欧洲的采用绿色政策的企业比例分别为60%和55%。

然而,许多美国企业正在实施绿色网格计划。绿色网格计划是由众多IT厂商和用户为了寻求降低数据中心整体能耗而成立的一个联合体组织。该组织的宗旨是开发各种平台中立的标准、检测方法、工艺和新技术来提高能源效率。

绿色网格组织董事会成员包括AMD、APC、戴尔、惠普、IBM、英特尔、微软、RackableSystems、SprayCool、Sun和VMware等公司。贡献成员包括近30家公司,包括Brocade、Copan、EMC、PillarDataSystems、QLogic、赛门铁克、VerariSystems和WesternDigital等存储厂商。此外还有75家参与绿色网格计划的一般成员公司。

在赛门铁克公司的调查中,几乎有85%的数据中心经理表示能源效率在他们的数据中心中至少被列为中级优先项目,有15.5%的数据中心经理将它列为重要优先项目。

在考虑各种让数据中心更绿色环保的措施的时候,IT经理们在软件和硬件上都有很多选择。他们甚至会考虑重新设计整个数据中心。据用户们称,象重复数据删除和分级存储结构等技术都是可以显著降低能耗的技术。

另外,还有许多由绿色政策组成的各种工程。其中最流行的是一些基于软件的解决方案,比如服务器统一和服务器虚拟化。实际上,有68%的数据中心经理称降低能耗对于他们作出服务器统一和虚拟化的决策起到了非常重要的作用。