系统容灾备份和业务高性能运行,杉岩USP异步复制实现兼得

当今时代,数据和信息犹如各行各业的业务基础和命脉。信息化在带来便捷的同时,也必须面对数据丢失的风险。

天有不测风云,自然世界,如火灾、地震等灾难事件时有发生。对IT人来说,当某处应用系统因为灾难停机,往往需要7*24小时紧急待机处理,期间还得对数据安全提心吊胆。

面对风险和难题,企业应该做好万全之策,例如更新容灾系统,守住最后一道保障关卡。本文就为你详解容灾系统中的重要“招式”——异步远程复制。

作为容灾系统的核心技术之一,存储系统的数据复制是一种可保持两地间数据一致性和实现灾难恢复的关键技术,当生产中心故障时,用户可利用灾备中心的数据备份恢复生产数据,此外也可以通过灾备中心直接提供运营支撑环境快速恢复业务,满足企业对RPO和RTO的要求。

数据复制实现原理和问题分析

同步复制or异步复制

当前,存储系统的复制技术通常分为同步复制和异步复制。同步复制可以做到主/备集群的数据同步更新,要求每一个写入操作在执行下一个操作处理之前,在源端和目标端都能完成;而异步复制因为采用周期性同步的方式,在处理下一个操作前,无需等待数据复制到目标系统中。

同步复制有着能最大限度地减少数据丢失量的优势,拥有更强的数据一致性,但也因此会影响生产系统的性能。而异步复制能在保证主从数据的最终一致性的同时,最大限度减少由于数据远程传输的时延而造成的业务性能下降。在建设容灾系统时,企业可以结合不同的业务场景,选择不同的数据复制方式。因此,如果不是业务上对此有非常苛刻的要求,在对业务性能要求高,但是RPO要求不高的场景,通常采用异步复制的方式进行容灾备份。

异步远程复制,快照机制成主流

目前,业界实现异步复制技术主要分为基于日志机制和基于快照机制两类。

1.基于日志机制

对于基于日志的数据复制,客户端的数据更新请求,首先要写入日志中,当日志写入成功,然后再把数据写入对应的存储空间。日志中会给每一个数据更新操作分配一个唯一递增的序列号,从而保障数据恢复时能够按照正确的顺序执行,保障数据一致性和完整性。备份集群从主集群远程读取到日志操作后,基于日志序列号在本地进行数据回放,从而完成数据复制工作。

该机制由于需要先把数据写入日志,然后再更新本地集群,因此至少有一次以上的写入数据放大,进而导致业务写性能存在一倍以上的性能下降,在异步数据复制场景比较少见。

2.基于快照机制

基于快照的数据复制,就是定时在主集群对数据进行一次“照相”,生成一个描述当前数据状态的快照。备份集群通过比较主集群两个快照差异,来确认快照间隔时间内所发生的数据变化,并通过同步快照时间的差异数据来完成数据复制工作。

图1 基于快照机制实现异步远程复制-初始全量同步

图2 基于快照机制实现异步远程复制-增量同步

基于快照的数据复制由于数据同步效率高,因此使用场景广泛。但是,由于需要通过频繁的更新快照来记录数据状态,并且通过比较两个快照之间的数据差异来实现增量数据同步,因此快照的的实现机制以及获取快照之间差异数据的效率决定了基于快照的数据复制机制的效率。

为了方便记录不同存储卷的数据状态,常用的方法是使用一个额外的索引位图。当存在数据更新时,先更新对应位图中的状态信息,再写入数据。但这种方式引入了两个问题:

1. 索引位图的更新需要通过互斥锁来保证一致性,在常用的块存储多路径场景,不同的存储网关更新索引位图时会存在锁竞争,导致出现频繁抢锁,极大地影响存储的写入性能。

2. 由于索引位图存储较为集中并且需要频繁更新,很容易成为写热点,进而影响存储集群的读写性能。

针对上述问题,杉岩USP统一存储平台通过基于快照机制的异步远程复制方案和深度优化,实现后台异步远程复制高效增量同步和用户前台业务高性能平稳运行两不误。

杉岩USP异步远程复制,打造高性能方案

杉岩数据采用基于自有专利的ALUA卷级负载均衡、自适应索引IO聚合和高性能RoW快照技术,提供一个高性能、高可靠的数据复制方案。

ALUA机制

杉岩USP在业内率先支持ALUA机制(点击查看:杉岩USP统一存储平台业内率先支持ALUA机制),避免了多路径场景的锁竞争问题,提升了不同卷的索引位图访问聚合度,大大减少下盘访问的平均开销,提升前台业务IO的整体性能;并且利用ALUA的动态负载均衡功能,可有效降低后台异步远程复制任务对前台业务IO的影响,而ALUA的秒级故障快速切换功能则可有效保障前台业务IO的平稳连续运行。

细粒度数据块状态位图和IO聚合

杉岩USP异步复制特性,可将卷或快照的索引位图拆分为更精细粒度的子块,并结合层次的内存元数据索引,既可加速获取快照之间的差异数据,又可减少对索引数据的频繁访问;并且索引位图数据打散存放,可避免频繁访问索引位图数据所带来的访问热点问题。同时,针对索引位图的更新还进行了自适应的IO聚合处理,进一步降低了更新索引位图对业务IO性能的影响。

RoW机制

杉岩USP异步远程复制的快照采用RoW(写时重定向)机制,可有效避免快照对业务写IO的影响,同时基于独有专利技术解决传统RoW快照造成空间离散影响读性能的问题,可最大程度降低异步复制快照对业务IO的性能影响。

价值总结

杉岩USP统一存储平台的异步远程复制功能既充分保证了高效的后台增量同步,实现系统容灾备份,又有效保障了前台业务的高效平稳和连续运行,使用户拥有了高可靠、高稳定、高可用和高性能的极致体验。主要价值如下:

远端备份和恢复:业务数据失效后,可通过远端的备份数据进行恢复,避免主端存储集群数据失效后,由于数据丢失造成的损失。

持续的业务支撑:灾难发生时可以通过从端存储集群快速接管主端存储集群的业务数据,以保证业务的可靠性,避免主端存储集群故障后,由于业务中断造成的损失。

容灾恢复:灾难发生后可以通过从端存储集群的数据实现主端存储集群数据的恢复,避免灾难发生后,由于业务数据丢失或恢复时间过长造成的损失。