自动分层存储大起底:谁最适合你的需求

自动存储分层(AST)功能已经开始越来越多地集成到供应商的设备中,但每个供应商的自动存储分层工作方式却不尽相同。大多数供应商的设备中并没有集成自动分层这个功能,但是也有一些供应商提供的功能比其他的更个性化和可控性。一些IT专业人士希望有一个“自动完成”的分层模式,而其他人则希望在他们的存储环境中能更好地控制数据迁移。找出不同的自动存储分层产品;决定哪一个更适合你的数据存储环境;固态硬盘与自动分层存储技术相辅相成将使分层过程更加完美。

无论是存储分层还是自动存储分层都不是新技术。事实上,惠普(HP)公司在1996年就声称已经实现了自动存储分层。然而,自动存储分层技术的普及却相对较慢。这是因为在那个时候,很难将数据进行分类,并且开发数据在层之间的迁移策略也很困难。大多数情况下,数据是按照时间长短来进行迁移的,时间越久其价值可能越小。

当前的自动分层技术则采用复杂的算法,根据供应商和预先设置,计算出从最小4 KB到最大1 GB数据块的利用率。这个计算结果是相对于其他数据的访问需求,但其并不是一个明确定义的“高需求”。、数据在高需求时段被提升到一个更高的层,而当需求减少时,数据也会被降到较低的层。该算法的质量决定了该产品的价值,而模块的大小决定了工作负载的适配性。较小的模块通常更适合随机I / O,而较大的模块更适合顺序I / O。

老牌供应商和新兴供应商都提供自动分层存储功能。新兴的供应商中的一些公司,如戴尔Compellent公司已经把自动分层存储技术变成他们产品架构中最重要的部分。利用该公司的存储中心产品线和流动数据架构,其只有一个阵列架构,并且自动分层存储是其不可分割的组成部分。流动数据架构的数据迁移模块大小大概是2 MB。

同样,对于Avere系统公司来说,AST在其FXT设备中并不是一个可选功能。 但是,其增加了用网络附加存储(NAS)或JBOD阵列作为第三层存储的能力。因此,Avere公司既提供交互阵列分层,又提供内部阵列分层。另外,Avere公司使用自己的文件系统,因此,其在数据迁移的算法上有一个额外的控制评估。FXT是“自动完成”模式,它不允许用户修改迁移策略,虽然层可以进行单独缩放以匹配工作负载的变化。

对于Arnold Worldwide公司的首席信息官格雷格?福尔瑟姆来说,简单是个关键因素。据福尔瑟姆所介绍,戴尔Compellent系统非常易于安装和管理。总部位于波士顿的广告代理商Arnold Worldwide公司采用的是三层方案和两种不同的存储政策。 “这些东西使用起来太容易了,当我们的存储管理员不在办公室时,连我都可以管理它们。”他开玩笑地说。

Arnold Worldwide公司的高级系统工程师克里斯?埃兰开始是使用戴尔Compellent默认的自动分层存储政策,但是随着时间的推移,他对其稍作了调整。戴尔Compellent企业管理工具帮助他识别使用模式。 “企业管理工具帮助我们精确了解数据在系统中是如何被访问的。有了这个信息,我们为一些应用程序创建一层1到2个策略,并为其他应用程序创建一层2到3个策略。我们已经使用该系统四年多了,而且我们没有必要改变这个策略。”以拦说, “新卷在创建时就被简单地分配了策略。

固态存储使分层更完美

Xiotech公司提供了另一个“自动完成”的AST实施案例。Xiotech的混合ISE (Hybrid ISE)产品在一个密封的14.4TB的 3U容器内融合了固态硬盘(SSD)和硬盘。在14.4 TB中,1 TB大小的容量是采用的固态硬盘(SSD),而其余的900 GB (10K RPM )则是使用的SAS硬盘(层2)。控制器级软件被称为连续自适应数据分片(CADP),它从部署的那一刻起就自动管理数据的位置。虽然该公司提供了一个图形化的ISE分析仪工具来突出显示I / O活动,但在实际应用过程中,用户却不能调整任何参数或配置。该公司表示,其设计的混合ISE(Hybrid ISE)从来不需要调整。

在这些供应商提供的更多可配置的架构中,NetApp公司强调的是扩展性能和单独容量的能力。该公司的闪存(PAM II)产品是类似于其他产品线的0层SSD。虽然它可以支持多层,但NetApp表示在许多情况下这些层可以被简化为两个:闪存和层2或层3。这是因为他们已经发现数据往往是“热”或“冷”的状态,很少在中间状态。缓冲区高速缓存被用来缓冲写入操作以避免性能降低。

数据模块迁移大小最小的模块是4KB。虽然这种架构可能需要比其他系统更多的闪存盘(占总容量的10%至20%),但消除相对昂贵的层1硬盘和散布跨多个SATA硬盘的冷数据可以较低的总成本实现相同的性能。此外,NetApp公司为了更大的空间效率,使AST在旋转盘上结合了重复数据删除和压缩功能。由于数据是通过WAFL文件系统和Data ONTAP来管理的,所以因数据变热而被从较低的层提升到0层时,它不必再“rehydrated”。同样,自动分层存储功能适用于所有NetApp产品线。

日内瓦的欧洲核研究组织CERN在Oracle RAC数据库上使用NetApp的闪存。 “在使用闪存之前,我们不得不一切以IOPS (Input/Output Operations Per Second)为基础来改变大小,而不管存储设备的利用率。”CERN的IT部门Eric Grancher说,“现在,我们可以优化IOPS和容量。我们已经从昂贵的光纤通道硬盘迁移到较便宜的SATA硬盘。这就使该组织的费用大大降低。” Grancher发现NetApp系统非常适应工作负载的变化,因此管理非常简单。他以经验判断存储中闪存的整体性能比在服务器中的要更好。 “稳定NetApp系统缓存中的数据比稳定数据库服务器更有意义,其需要修复补丁或更新而频繁地重新启动。存储服务器上的数据高速缓存已经“回暖”,从而消除了表现不佳的必然期,在每次重新启动后,我们将遭受冷服务器高速缓存。”他说。

EMC全自动分层存储(FAST)是可配置系统的另一个例子。FAST的安装向导可让你使用简单部署的默认配置。EMC表示,用户在大多数情况下为“自动完成”做好充分配置。其他用户则可点击进入FAST层顾问,这是一个实用工具,用来收集过去使用的统计数据。这些统计数据可以用来制定特定应用程序的优化政策。用户还可以从768 KB到1 GB的范围内设置数据移动模块的大小,这取决于其倾向于随机读取还是顺序读取。

EMC建议用户分配给0层约3%的容量,层1为20%和层3为77%的初始容量。层顾问将跟踪使用情况,并随着时间的推移,层1应被最小化,其稍微多于较高层和最底层的缓冲层就可以了。无论怎样,层顾问都是让用户根据实际使用模式来优化层。

你应选择哪一个自动分层存储技术?

总体而言,供应商提供了一系列不同的自动分层存储技术和不同性能的产品。那么我们如何选择最适合企业自身情况的产品呢?了解适合企业环境下的特定需求,然后选择最能满足你需求的产品。了解企业的性能需求将有助于把你的自动分层存储产品发挥到最大效用。