EqualLogic管理数据增长的动态存储分页架构

    存储虚拟化是用于处理几何级数据增长的最强大的技术之一。存储虚拟化的概念相当简单:存储地址空间经分割或组合变成更小或更大的地址空间,然后 SAN 中的主机系统即可使用这些虚拟地址空间。
  
    使用虚拟化技术组合地址空间以创建更大的地址空间的功能对于控制几何级数据增长具有其内在的价值。从今天的观点来看,虚拟化是用来使存储技术适应新的高增长环境的最有效的技术。
  
    迄今为止,虚拟化架构因 I/O 路径中的虚拟化功能的位置而出名。三个最显著的位置是:
  
    1. 主机系统软件中 ?? 通常称为卷管理
    2. 网络中 ?? 在专门的虚拟化系统中或在交换机中
    3. 在存储域中 ?? 作为存储子系统控制器提供的功能
  
    存储域中的虚拟化
  
    虚拟化与存储域中分布式处理模型的结合是存储虚拟化未来的最大亮点之一。此概念是使多个子系统协同操作,并共享总资源。这些子系统没有必要使用集群技术,因此免除了集群需要的所有管理费用 ?? 只要它们在需要时彼此提供及时的 I/O 服务即可。具有这些特点的架构能够跟上几何级数据的增长,而不像传统的单片存储子系统那样依赖磁盘驱动器。
  
    鉴于现有的存储产品和技术没有为几何级数据增长提供解决方案,因此需要新的方法来解决这个问题。EqualLogic, Inc 的存储器产品提供了一种架构,这种架构能够出色地避免传统的存储器缺点。但是为了理解 EqualLogic 的存储器架构,我们首先必须研究一下另一种技术 ?? 虚存页面对换。
  
    存储分页
  
    发明虚拟内存技术是为了使系统能够将磁盘空间用作当前不处理的应用程序数据的临时存储位置。页面对换是一种虚拟内存技术,它识别称为页面的特定内存地址范围,并将这些页面中的某些页面临时存储在磁盘上,以便为内存中的其他附加应用程序和数据腾出空间。页面对换可描述为一种反缓存机制,其中应用程序不使用的数据存放在稍后可以检索这些数据的磁盘上。
  
    用网络技术的语言来说,页面对换允许系统“超额定购”它们能支持的应用程序数目。页面对换不依赖应用程序使用的任何寻址机制,而且内存分页操作对于系统上运行的应用程序是完全透明的。页面具有相同的数据量,这一概念很重要,因为这表示所有对换操作都能够以最高效率完成 ?? 无须计算和沟通数据的大小或其界限,因为这些都是相同的。
  
    EqualLogic 的设计师以存储页面为基础构建了一个系统。他们推理,磁盘存储器能够分段成为大小相同的地址范围,这与页面对换操作中的内存分段方式相似。主要的不同是存储页面不是要在系统内存和磁盘之间对换,而是可以在 SAN 中协作的任何数量存储系统中定位和重新定位存储页面。
  
    为了完全理解 EqualLogic 架构控制几何数据增长的功能,必须分析 SAN 环境中存储分页的可能性。EqualLogic 将其产品设计成在 SAN 中使用的网络存储系统,它们将与其他 EqualLogic 系统合作,共享存储资源,并根据要求在共享的资源中重新定位存储页面。
   
    基于存储池分配的无形之手
  
    EqualLogic 环境中的存储资源不受系统最大磁盘空间的限制,这一点与传统 SAN 存储器形成鲜明对比。EqualLogic 系统将存储器作为存储池分配,这些存储池能够与 EqualLogic 系统上的其他存储池合并和组合,以形成虚拟存储地址空间。存储池是一种虚拟结构,用来组织存储资源,从而更方便地识别和控制这些资源。这可能促使读者将 EqualLogic 存储池视为宏存储结构,该结构受 RAID 保护,并且将独立运行,或者作为存储池团队的一个成员运行。
  
    作为控制几何级数据增长的一种工具,存储池向存储器管理员提供一种非破坏性的方法以增加现有存储地址空间的存储容量。增加现有存储地址空间需要将 SAN 中可用的存储池添加到需要容量的存储地址空间。EqualLogic 架构中的增长方案是向 SAN 添加新的存储系统,通过管理员界面创建其存储池,并将一些存储池添加到 SAN 中的其他现有存储池。
  
    EqualLogic 架构中的虚拟地址空间与网络虚拟系统相似,包括系统坐标(例如网络标识)。这意味着输出到主机系统的存储地址空间可以由若干 EqualLogic 系统的总容量组成,以满足某些应用程序的需求。然而,在大多数情况下,客户更迫切地需要管理大量的,容量不断变化的压力点。EqualLogic 架构的分布式、协作化的设计与资源共享并在共享的资源中在线重新定位页面的功能相结合,可以帮助其客户处理几何级数据增长问题。
  
    自动 I/O 平衡和分页
  
    虽然许多人都在有效地使用基于网络的虚拟化,但值得与 EqualLogic 架构相提并论的并不多。首先也是最重要的,EqualLogic 架构提供自动负载平衡,作为其分页算法的一部分。这些系统在 SAN 中合作,监控它们的状况,并定期在系统之间交换页面,以避免破坏性的容量危机。换而言之,EqualLogic SAN 提供在线容量管理功能,大大减轻了与传统 SAN 存储子系统相关的存储容量监控负担。此功能通过存储页面的定义在架构上得到支持,使系统间的传输有效且可靠。因为 SAN 中的所有 EqualLogic 存储系统对于彼此都是有名的实体,因此系统间传输过程中可能发生的中断和错误是可预知的行为。
  
    EqualLogic 系统可用来发现彼此。将新系统添加到 SAN 时,系统识别添加的新系统,存储管理员将有机会自动向现有存储池添加(提供)新系统存储池。不应低估完成此操作的便捷性,也不应低估 EqualLogic 自动资源预配置的价值,因为后者排除了安装和资源预配置过程中可能的人为错误。最终结果是,这些产品能够(并且通常)由客户员工安装和管理,从而无须昂贵的专业服务。
  
    因为向 EqualLogic SAN 添加了新的存储系统,所以网络存储路径的数目也增加了。通过与不同系统中的跨存储池自动 I/O 平衡相结合,增加了 SAN 的总吞吐量,而不必进行传统单一 SAN环境下 的长时间性能分析工作。换言之,花在调节 SAN 性能上的时间大大减少,在许多情况下,(这些)自动化的优越性能对于管理员是完全透明的,因为他们(通常)从来注意不到性能的退化。
   
    小结
  
    全面的几何级数据增长是当今 IT 企业面对的最紧迫的问题。不幸的是,传统的存储技术、产品和方法处理这种问题表现出明显的缺陷。
  
    人们已构想几种技术概念(例如 HSM、ILM)和分层存储来尝试处理几何数据增长问题,但这些方法都没有显示出多少功能来使大多数企业能够处理其数据增长问题。这些技术仍可能在某一天成为更有效的方法,但除非它们显示出更实在的潜力(而不只是承诺),否则客户就应为其数据增长问题寻找更直接的答案。
  
    答案之一在于新的处理模型和数据存储架构,它们从根本上改变了存储器的工作方式。EqualLogic 为其 SAN 解决方案设计的存储架构即是一个新存储架构的例子。简言之,结合分布式/合作型处理和基本分页结构与机制,来代替传统主/副 SCSI 块处理模型会大大地减轻存储管理的负担。
  
    不能阻止几何级数据增长有许多原因,但这并不表示不能成功解决这个问题。协作化存储分页是一项巨大突破,显示出控制几何级数据增长的真正潜力。