Savvis副总裁 云计算中存储必备的9大要素

介绍

在最近对云计算的所有关注中,存储更多地被视为基础平台。时至今日,许多云计算提供的仅仅局限于CPU内核的集合,定量的内存分配,低转速存储,或者还有一些面向互联网的IP技术。近来,出现了有趣的与云计算和存储相关的高级技术,特别是使用Web Services访问方式,使得访问存储不再受限于设备文件或者NFS加载点。

典型的数据存储和管理的"企业级特征"在IT架构创新上不断推成出新。存储架构师意识到这些特征对于关键业务和生产应用非常重要,但目前的云计算还缺乏这些特征。本篇白皮书的目标是描述企业云计算中存储必备的9个要素。

要素1:性能

性能需要付出成本。在一个架构良好的应用里,性能和成本处于平衡状态。达到这点的关键是使用合适的技术去匹配企业业务应用的性能,首先要求将企业的业务语言转换成IT模式。因为这种转换困难,通常企业止步于静态的IT架构,无法应对业务变化着的性能需求。企业云计算提供了一个更能应对变化着的性能需求的平台。

在早期的云计算平台里,存储I/O一般都会有较高的延迟。这是因为厂商注意到使云计算的数据更容易访问,但没注意到提高与性能、带宽和IOPS相关的服务级别。有两个原因导致延迟较高:访问的模式和类型,以及存储分布的配置。

访问模式包括位于OSI模型物理层之上的多层协议的组合(如SOAP, NFS, TCP, IP和FCP)。数据访问包括共享的物理服务层(如以太网)和几个协议层(如SOAP或NFS),一般比专门的物理层(如FC)产生更多的延迟。市场上大多数云计算平台包括Internet的数据访问,产生了更多的数据访问延迟。

对于存储介质,大多数云计算的市场在RAID或JBOD配置中使用SATA磁盘。因为SATA(有段时间被视为近线磁盘)的性能一般比企业磁盘(一般指FC盘)稍差一些,导致存储设备的性能低于应用的需求。

当你采用低性能存储介质的相对低带宽和高延迟的访问模式时,使用整个存储子系统的企业无法支持更多的关键业务应用的需求。其结果是,这种方案通常仅适用于测试和开发。

相比来说,企业云计算平台需要提供更多不同性能存储层的选择。当性能需求的变化时,例如,应用从测试迁移到生产环境,存储平台应该能使用这种变化。理想的企业云计算的存储应该有多种性能区,能够被调整,以提供合适的I/O性能级别给业务性能的需求。

最后,为了满足企业高端存储的性能需求,云计算方案必须采用高于或者目前正在使用的企业级技术。一般使用FC SAN。此外,如何使用技术与技术本身同等重要。在一个系统管理环境里,企业级需求下的虚拟机配置必须能够持续提供高性能。

要素2:安全性

安全性和虚拟化通常被视为相互矛盾的。毕竟虚拟化使得应用从物理硬件和网络边界中解放出来。安全性,换而言之,就是建立边界。企业需要考虑虚拟化设计的初始架构。

在大多数云计算市场里,无论公有的还是私有的,数据安全性都是基于信任的,这信任通常都在管理程序里。当多数虚机共享物理LUN,CPU和内存时,由管理程序确保数据是否毁坏或者被错误的虚机访问。这与集群服务器多年来面临的基本挑战相同。任何也许需要接管进程的物理服务器必须能访问数据/应用/操作系统的权限。例如,为了主机外备份,LUN也许需要映射给公共的备份服务器。

在企业云计算中,有两种方式去保护业务数据。第一种涉及系统程序管理安全。主要的目标是:系统尽可能少地被使用,避免任何虚拟机被其他虚拟机造成负面的影响。企业也需要保护LUN被其他服务器访问,如同主机外备份服务器。

其他需要注意的地方是数据通道。企业必须注意只能给需要维护必要功能的物理服务器提供访问路径。这可以通过NPIV(SAN N端口 ID虚拟化)使用得Zoning、LUN Masking、访问列表、权限配置来完成。

要素3:自动ILM存储

信息生命周期管理(ILM)曾经成为非常有效的市场行为的重心,被那些出售分层存储的厂商所推崇。虽然ILM本质上非常简单 – 存储的成本与数据的业务价值相匹配,实际的挑战来自于真正的执行效果,众多所谓的ILM方案,粒度都不够细,难以达到这样的目标。

今天,传统的ILM并没有部署到市场上的大多数云计算平台中。原因有两个,第一,在许多云计算中,大部分磁盘介质采用处于典型ILM方案中的最低层存储,这样就没法把数据往更底层迁移,ILM也就无法部署。第二,许多企业不需要为云计算常用的计算类型而更长时间地管理数据,因为传统云计算通常用于功能测试/开发、概念验证(POC)、Web服务器测试等。考虑到多种因素,实施ILM策略所需细粒度的复杂性和成本与经济节省的云计算不相符。

根据一些行业报告,70%的数据是静态的。通过将合适的数据存储在合适的介质上,企业能削减成本。他们能意识到通过部署云平台能节省成本,在云计算中实施ILM带来的经济效益意义重大。但前提是无需中断应用,而且不能增加不必要的操作复杂性。

为了做到这些,企业必须使用基于策略的块级ILM方法,无论访问方式和应用类型。通过在数据块一级跟踪数据的属性,就无需在操作系统这一级执行数据归档或数据迁移。这种方法还能独立于操作系统类型,且独立于用于存储数据的访问方式。它不仅在保持性能(所有的数据写入都在高速层完成)的同时优化存储的成本,而且通过将不使用的数据块沉淀到低速层减少电能的消耗。这很合理,因为近线存储仅消耗企业存储的大约20%的能耗。为此,要做到真正适合企业级应用的自动分级存储,卷级文件级数据迁移无法胜任,颗粒度必须细化到数据块级。只有数据块级的数据迁移才可能独立于操作系统类型,且独立于存储数据的访问方式,做到对应用支持的随需相应。

要素4:存储访问模式

访问存储空间有三种主流方式:基于数据块(FC SAN或iSCSI)、基于文件(CIFS/NFS)、或通过Web服务。基于块和文件的访问方式在企业应用中最常见,能更好地控制性能、可用性和安全性。在这点上,市场上大多数云计算平台利用Web服务的接口,如SOAP和REST(代表性状态传输)访问数据。虽然,这是最灵活的方式,但有性能的影响。理想的情况是,企业云提供全部的三种访问存储的方式来支持不同应用架构。

要素5:可用性

IT架构的维护窗口被大量的缩减,因为企业需要支持在不同时区的用户并保证全天候的可用性。虽然服务级别协议(SLA)一般与可用性密不可分,从业务角度看,它难以衡量,因为有着多种架构的复合SLA的重叠。

在前面提到,在市场上大多数云计算平台中,I/O性能最先得到考虑。如果云平台依赖于不被内部IT集团管理的部分架构,那么冗余的架构部分和途径是减少停机风险的最佳方式。虽然,云存储服务提供商在考虑成本的同时继续增加可用性,但是目前市场上的服务级别协议不能满足企业关键应用的需求。

在高端的企业级云计算中,存储系统够出来企业内的企业级存储方案,包括多路径、控制器、不同的光纤网、RAID技术、端到端的架构控制/监控,和成熟的变更管理过程。在低端的企业级云计算中,存储可用性与今天市场上云计算平台的服务水平相当。为了提供企业需要的服务水平,企业级云存储供应商必须利用健全的架构设计和被充分验证过的创新技术。

要素6:主数据保护

主数据指的是在线运行的数据。主数据能够采用单一技术,或者结合多种技术进行保护。一些常用的方法包括:RAID保护、多份拷贝、远程复制、快照、和持续数据保护。

在市场上大多数云计算平台里,主数据保护的问题常常留给用户。今天,很少发现上述的方法在大众云计算平台中使用,因为技术的复杂性和成本。有一些大众云存储方案通过维护数据的多份拷贝来保护主数据,整个系统运行没有RAID保护的存储里,以此降低成本。

企业级云的主数据保护应该基于内部企业级方案。当方案的业务影响分析(BIA)需要时,例如快照和容灾等可靠的技术应该就绪。

内部企业方案和企业云存储的主要差别在于,主数据保护在方案中是如何绑定的。为了延续根据需要部署云环境的经验,各种选项必须打包,这样服务能自动部署。其结果是,将一系列绑定的选项打包,能够应对大量需求。也许不存在可以利用快照、远程复制等与客户需求相匹配的技术。无论如何,多数用户将意识到,常常需要牺牲灵活性去获取在企业云中其它的管理好处。

要素7:次级数据保护

次级数据来源于主数据的历史拷贝来形成备份。这种数据保护意味着减少数据损坏,恢复被删除或被写覆盖的数据,为了业务或法规的需要将数据长期保存。典型的方案常包括备份软件和几类存储媒介。数据重复删除也许能被用上,但这在关系到数据隔离的多用户环境下,可能产生些问题。

有些商业和公共领域上的方案,被加入到大众云存储中,以完成次级数据保护。但大众云计算平台的供应商很少将这些与在线存储一并打包。虽然原因各异,但在许多情况下,与恢复时间和保留期相关的服务水平(SLA)问题很难处理。

无论方案是私有的还是多客户云平台,管理手段、可见性和恢复的服务水平是次级数据保护的关键。一旦提交恢复请求,恢复的启动应该直接而且能够自动完成。用户应该能掌控可预见的恢复性能水平(恢复的数据GB/时长),而且应该能从一个简短的选项列表中选择保留的时长。最后,用户应该能检查那些在线备份的状态。因为频度和保留期决定了存储备份所需的资源 – 也就是成本 – 客户应该能够在线观察资源使用状况和收费情况,以免在结账时感到意外。

要素8:存储的灵活适应性

存储的灵活适应性是指能够根据业务的需要的变化做到存储资源的随需响应。归根结底,它取决于操作系统对存储变化的检查能力和所使用的访问方式。

在这里讨论的9个要素里,这一点是大众型云计算平台做得最好的要素。大多数方案都有按照预先设计的数量,逐渐增加存储的能力。删除空间也是一个选项,通常用于卷或加载点。如上所述,操作系统对存储变化的应对能力通常是个局限。

支持企业云需求的存储需要能灵活扩展,需按照客户能理解的方式计费。虽然增加和删除存储空间非常重要,用户倾向于仅为其用到的空间付费。他们也希望在基于Web的管理方式下,具有调整和生成使用状况报表的功能。这种功能帮助他们控制成本,提供业务规划的智能。

要素9:存储报表

当公司考虑将其全部或部分IT架构外包的时候,经常顾虑的是这些特定技术的不可见性。客户需要包括从容量和性能角度了解运行环境的状态。为了达到这个目的,通过用户管理界面,输出丰富的存储报表成为必须,使得客户对于存储高效的运行充满信心。

在市场上云计算平台里,与存储相关的报表是最基本的工具。许多提供商提供标准的报表来使用,在一些场合下,他们也提供基本的性能评估工具,或者来自提供商,或者来自共享厂商,或者是第三方工具。

企业云比传统企业存储有优势,传统企业存储常常导致客户使用单一存储厂商的方案。这使得报表非常简单,因为数据不用像来自多厂商平台那样,需要进行翻译,才能生成一份统一外观的报表。有关历史和实时使用情况的详细信息,连同一些关键性能指标 – 历史的或实时的 – 应该可通过用户管理界面7×24小时实时查看。最终,为了减少企业对失去控制的担忧,云计算的提供商应该具备更综合性、更精确的报表能力,尤其是对于存储系统使用情况的可见性。

结论

一个强健的企业级云不应该只片面关注CPU、内存、磁盘、和IP地址分配,在规划企业级云计算平台策略时,应该包括本文所提到的9大要素。这样,企业才能拥更完备的云计算平台来支持业务运行。

注:美国SAVVIS机构(纳斯达克:SVVS)是全球领先的专注于建设、提供企业级云计算平台(而不是大众型云计算平台)的服务供应商。SAVVIS的企业级云计算平台包括遍布全球的28个企业级外包数据中心,基础平台构建于Cisco网络服务、VMware服务器虚拟技术和Compellent虚拟存储系统。SAVVIS的典型用户为大型企业级用户,而不是大众型云计算的SMB或个人用户。更多资料参见www.savvis.net。