部署次LUN分层之前需考虑的五大核心问题

每家自动化分层存储厂商所使用的技术差别很大,因而潜在的使用者在实施之前有必要进行一系列关键指标的评估工作。以下列出了在开始次LUN分层之前所应当先考虑到的五个问题:

你的自动化分层软件支持多少层级?

当着手进行基于数据块的自动化分层时,首先要考虑的事情之一就是软件支持的分层数量,因为即使IT部门在一台阵列有3到4层的存储,但自动化分层软件可能不一定完全支持。

Compellent技术有限公司(已被Dell有限公司收购)的Data Progression、EMC公司针对其Virtual Pools(FAST VP)的Fully Automated Storage Tiering,HP公司的StorageWorks P9500,HP收购的3PAR公司的Adaptive Optimization以及Hitachi Data Systems Dynamic Tiering可以自动化地在三个层级中迁移数据。同时,IBM的Easy Tier支持两层,而其中一层必须是固态磁盘驱动器。不过所有这些供应商支持固态、光纤、SAS和SATA磁盘混合的3层或更多层结构,而且还支持不同转速的磁盘混合。

“三层应该是你需要的最大数量了”Wikibon Project的首席技术官David Floyer说道,“我想,如果将10K的光纤磁盘和15K的之间也分一层,那可能会出现回报递减的情况。其相对的性能差距并不很大,成本状况可以略微改善,而间接管理成本却高出很多”

Compellent的3层系统将15,000 rpm 和10,000 rpm的驱动器看作是一样的,可将数据块放置在任意的可用空间上,公司产品市场部总监Bob Fine表示说。

大型IT企业会有一系列不同的应用程序,可能会需要花费更多投资在额外的数据分层上,不过他们或许同样可以应用两层分层。“有一些很好的设计方式只需要两层:固态磁盘和慢速磁盘,”Gartner公司的存储技术和策略研究总监Valdis Filks说道,“如果你不了解你的需求,你就无法确定对于你而言最佳的分层是几层。”

数据块大小对于迁移是否有影响?

存储管理者需要确认其自动化分层软件是否运作在其次LUN分层上,这样可以确保他们可以将其昂贵的存储空间预留给对性能要求高的关键业务数据。不过过分计较系统迁移时的数据块大小就显得没有必要了,这是存储厂商考虑的事情。

用户会发现针对他们的自动化分层数据而言,可选的数据块大小选项并不多,Compellent的Data Progression提供512KB、2MB(默认大小)或4MB的选项;IBM的Easy Tier只可选1GB的大小;EMC的Clariion和VNX亦仅提供1GB的选项,而其Symmetrix提供768KB~370MB的选择。

ESG实验室副总经理Brian Garrett创设了以下虚拟场景来解释数据块大小如何对自动化存储分层产生的影响。假设一个存储系统以8KB的增量将热点数据块从一个硬盘驱动器上迁移至固态磁盘以提升一个数据库应用程序。假设数据块大小为512KB而自动化分层系统以512KB为增量单位移动数据块,系统可保持100%的使用率。但如果系统迁移1MB的数据块,那么系统效率大约只有50%,因为系统不仅将512KB的热点数据块进行迁移,也将后面的不太使用的数据也一起迁移了,因而浪费了一半昂贵的固态存储空间。

“更小的数据块可以提升效率并增强各次LUN之间迁移的成本效益,”Garrett在一份邮件中写道,“不过更小的数据块增加了需要监控和跟踪次LUN迁移时的元数据。元数据通常存储在高速的内存之中,这增加了成本。而进行更多的元数据更新和检索亦影响到了性能。”

根据在Gartner 的Filks的意见,数据块对于小型企业而言无关紧要,他们通常对其系统内部工作并不太注重,不过对于那些复杂的高端用户而言这还是相当重要的,这些用户希望基于其应用程序需要调整系统来优化性能。

“对于怎样的数据块大小是最合适的?这是存储市场上争议最多的话题之一,”Filks说,“在之前20年中,每当调优数据块时都会有这种争论”

Wikibon Project的Floyer说供应商不断和其讨论数据块大小的问题,不过他认为这是“废话”。他建议用户去“关注你们可以节省多少成本,关注业务情况。问自己是否可以以此报告预测可以节省多少成本?这比担心数据块大小要重要20倍。”

自动化分层软件在将数据迁移至其它层时如何收集、分析负载量?

一些基于数据块的存储系统配置此功能,可以在将数据迁移至其它层之前花几分钟内进行次LUN分层收集和分析功能。而另外一些则可能要花24小时来进行此项评估。有一些则提供客户不同的选项。

举例而言,Dell的EqualLogic XVS阵列在进行固态磁盘和SAS磁盘之前会有一个大约10分钟的学习过程。HP收购的3PAR的Adaptive Optimization和HP的StorageWorks P9500有一个小时的最小抽样段,虽然客户同样可以选择客户化的时间片段。

EMC号称其Symmetrix阵列可以基于实时工作负载分析进行数据迁移,而其Clariion系统可以根据一个24小时的时间窗口的分析进行基于数据块的迁移。一个EMC的代言人说分析时间是根据典型工作负载进行优化的,不过用户同样可以定义自己的策略。举例来说,你可以选择一个周一到周五,早6点到晚6点的时间窗口进行分析,从根本上控制系统何时进行数据迁移。

IBM的Easy Tier会监控1GB数据块的活跃情况,确定数据的“热度”,并创建一个“热度地图”,然后每24小时算法会计算出一个数据重定向计划将数据迁移到最合适的层级。

24小时的分析方式对一个每天都同样运行8个小时,不断循环的应用程序最有效,反之,动态的,快速变化的工作负载可能更适合快速的评估周期,Evaluator 集团公司的资深策略师Randy Kerns指出。

你如何监控自动化分层软件的效能?

IT部门可以找到专业的服务来事先确定自动化分层所带来的潜在价值。或者他们可以尝试用供应商提供的工具来预测自动化分层的效能,然后监控数据迁移和系统性能。

一些工具不仅可以反映正在进行的情况,还可以预测一些问题,比如改变总的固态磁盘对性能可能造成的影响,或增加一定数量的SATA磁盘所能带来的成本效益,这种问题通常和成本节省计算有关。

确定哪些应用程序使用固态磁盘的高性能或SATA磁盘的成本效益,或确定一个IT部门需要多少固态磁盘或SATA磁盘,这类问题非常复杂,需要慎重的计划,ESG实验室的Garrett说。

“我们只开始关注一些工具,不仅可以模拟性能影响,还可以模拟价格影响,”Garrett说,“有朝一日,我们会拥有界面更加友好的工具,更简易的方式来进行模拟。不过,目前这些利器只能通过专家之手进行操作。”

就EMC而言,其通过专业化的服务来计划并实施FAST VP,不过其同时也提供了一个免费的分层指导软件来基于应用程序负载计划和模拟FAST配置。

Compellent的Enterprise Manager生成报告,在分层配置下显示容量使用、电能和二氧化碳的节省情况。

日立数据 Dynamic Tiering的使用者可以通过Hitachi Command Suite 或Storage Navigator 2来监控自动化分层,图形化的报告会显示分层设置的位置以及每层对应的I/O负载情况。当服务级别降低至期望的标准时管理者会被告警。

IBM的Easy Tier包含一个Storage Tier Advisor Tool (STAT),可以报告系统池中每个卷的负载情况或预测Easy Tier配置固态磁盘的效能情况。

自动化分层软件提供你怎样程度的策略设置方式,或自动化分层控制方式?

自动化分层软件可以最小化时间消耗,并且能将数据在合适时间迁移至合适地点,不过其也提供在存储分层过程中一定程度的控制。分层产品不同程度地提供了基于个性化需求设定策略的可选项。

举例来说,Compellent Data Progression提供两种策略,默认的是针对存储管理经验有限或根本没有的客户,以及可客户化的策略,其适用于那些希望根据应用程序,RAID级别或其它配置选项进行分层的IT部门。用户可以在一段时间内为某一层锁定一个卷,将其用于一个关键应用程序,比如ERP数据库,或者更典型的,可以为驻留在高速磁盘上的数据设置一个到期时间,Compellent的Fine表示说。

日立数据的用户也可以锁定本地的Dynamic Tiering卷,以及在除了“热点分析”中选定的时间阶段控制监控周期的持续期间,该公司一位资深产品市场部经理John Harker说。

HP收购的3PAR存储系统允许用户基于性能、成本或两者的组合定义最优化模式,以及修补评估性能或迁移数据的时间表。

EMC FAST VP允许用户不仅对单个存储设备分配策略,还可以针对一个或多个相关LUN组成的存储群。这些策略定义了三个存储层的存储池以及每个层级的最大使用空间。

“你可以指定哪个应用程序或哪个用户可以迁移至不同的存储层,”Gartner的Filk说道,“举例来说,你可能不希望YouTube的应用程序使用SSD,那太浪费你的存储资源了”。

管理员同样需要照顾到在月底的时候,财务方面的应用程序变得非常重要,不应被放置在低速的存储层上。

“这是常识,”Wikibo Project的Folyer说道,“别惹出太大的麻烦,技术上可以做并不等于你应当这么做”。