让灾备不惧“遥远”--基于IP的复制技术

灾备的宗旨,是把生产中心的数据搬到远程"克隆"一份并保存,因此,灾备距离成为了灾备系统的重要衡量标准之一。但与此同时,"加长"的灾备系统使得传统灾备建设遇到的问题变得更为突出。首先,在传输距离上受到限制,例如2007年国土资源部决定将国家地理信息等战略级数据从北京远程备份到2000多公里之外,如果采取传统方式,不仅系统构建复杂,而且链路成本也十分高昂。其次,面对不同的灾备目标,比如业务允许的停机时间或者允许丢失的数据量,不同业务系统的灾备建设在技术选择上也面临着复杂难题,单一技术无法满足不同的灾备需求。第三,如何保障数据完整地备份到灾备中心,如何解决传输中可能遇到的安全性问题,如何确保灾备数据完整可用,是灾备不惧"遥远"的第三大待解之题。

因此,借助无处不在的IP网络,简化灾备远程部署,实现灾备从局域到广域的跨越,成为解决远距离灾备问题的一个新思路。IP存储领导厂商H3C充分继承和发扬基于IP的复制技术优势,满足生产中心和灾备中心间数据同步需求的同时,在低带宽链路情况下,实现"IP可达、数据可达"的目标,保障完善的数据一致性,在远程灾备应用上迈出了更为实际的一步。

小带宽,大智慧

灾备系统建设中,除了存储设备的投入,还需考量传输链路的投资成本。由于租用链路成本不低,并且涉及到持续投资问题,因此,选择哪种灾备链路,如何降低链路的租用费用,是用户灾备建设中最关心的问题之一。

可以看到,不同带宽的链路租用费用差异较大,所以尽可能提高链路使用效率,是发挥灾备方案优势的大前提之一。

在传统存储的灾备建设中,对灾备链路长度要求较高,如果实施远距离灾备,需要通过协议转换设备完成FC协议到IP协议的转换,以实现广域网数据传输。对此,H3C灾备方案基于现有的IP链路,无须重新部署线路或者增加协议转换器,即可实现"IP可达,数据可达",从而大幅缩减部署灾备方案的成本。

对于珍贵的广域网带宽资源,需要进一步提高带宽利用率以降低链路租用成本。鉴于此,H3C采取了增量复制技术,即在业务进行的同时,每次复制仅同步两次复制之间变化的数据,将大大减少了传输的数据量。在此基础上,H3C创新地采用微扫描、数据压缩等关键技术,实现传输的"重复数据删除"。微扫描(Microscan)技术是针对以随机IO读写为特征的应用,比如数据库应用等,可以在复制期间动态分析每个复制块,以更小的颗粒度(512字节)区别出数据块中已经更改的扇区,而不是整个文件、整个表或者整个目录,传输差异数据将更少,释放更多传输带宽。针对链路带宽特别小的情况,在数据传输过程中,可选择对每次要同步的数据块进行压缩,压缩比率最大可达4:1,进一步减少最终需要通过广域网传输的复制数据量,在512Kb-1000Mb链路上均可以实现灾备建设。针对常见的广域网传输链路不稳定的情况,H3C基于IP的复制技术支持断点续传的传输方式,即在复制过程中遇到传输中断的情况下,可以采用链路恢复自动检测技术,自动重连链路,从而提高复制成功率,为用户的重要数据实现多重保护。

根据实测数据,相比传统数据同步技术,H3C基于IP的复制技术可以使带宽使用效率增加8倍,进一步提升带宽利用率,提高灾备方案的总体TCO水平。

灵活策略,满足不同需求

根据国家标准《信息系统灾难恢复规范》中定义的不同灾备等级,不同的业务和应用具备不同的RTO(恢复时间目标)和RPO(恢复点目标),如果全部采用相同的数据同步方式,显然无法获得最合适的灾备方案。H3C基于IP的复制技术提供了丰富的复制策略,以满足不同的灾备应用要求。

一方面,针对链路带宽较小的灾备系统,可以根据业务制定不同的灾备目标,确定系统允许的业务停机时间以及数据丢失量,进行策略性复制(按预定的时间周期或阈值),以便最大程度提高链路利用率。H3C策略性复制分为两种:阈值触发方式,是指当数据变化量达到阈值时启动复制,变化量最小可设为1MB,特别适用于数据更新不太频繁的应用;也可采取周期触发方式,启动初始复制后每隔设置的时间就触发一次复制,周期最短为10分钟,可以在最大限度保障当前业务性能的同时,灵活满足不同业务的RPO目标。

另一方面,对于那些要求业务停机时间和数据丢失量极低的应用系统,可采取自适应复制的方式。从原理上来看,自适应复制是策略性复制的优化。自适应复制功能使得数据中心和远程灾备中心之间通过IP网络对关键业务进行不间断复制,在灾备中心中可"准实时"提供数据的完整副本。当灾难发生时,可以将数据丢失量降至最低,满足更苛刻的灾备RPO等指标要求。

通过这些灵活策略的数据同步方式,使得各种不同等级的灾备应用都能充分利用IP网络的优势,并且可以按需满足不同应用的灾备目标,实现更为有效地远程数据复制,对于远程灾备应用来说,事半功倍。

数据一致,保障安全

灾备的根本是为了生产中心一旦发生故障,灾备中心的数据能迅速恢复并且可用。但是,"可用"二字却并非易事。在数据中心运行过程中,存在着大量的中间状态数据,例如存放在数据库缓存、控制器内存等位置的数据,一旦业务突然中断,这些数据没有及时存放到存储阵列上,造成数据的不一致或不完整,对于数据库等应用,会带来无法启动和恢复的风险,同时在广域网链路传输过程中可能存在的数据窃取等,都会使灾备数据面临着"不可用"的危险。因此,如何保障数据一致性、如何确认传输过程中的数据安全,是灾备建设的又一大关键命题。

H3C TimeMark全自动连续数据保护功能巧妙解决了灾备数据一致性问题。TimeMark技术通过给数据"拍照",以保障多达255个关键时间点的数据存有完整可用的数据副本。在每次给数据"拍照"之前,会通过在服务器上安装的快照代理,通知数据库等应用将缓存数据下刷到磁盘阵列,保障"中间状态"的数据完整的存放到存储设备上。如果同一个应用的数据分布在多个生产卷上,TimeMark一致组技术还能提供多个"镜头",确保组内源卷同时创建快照、同时从快照组恢复。基于IP的复制技术融合TimeMark技术来保障复制过程中的数据一致,每次复制启动时,灾备中心的存储将自动记录副本磁盘的临时状态,待复制成功完成后临时记录状态会自动删除。如果在复制的过程中生产中心发生了灾难,就可以通过临时的记录进行快速数据恢复,从而保障数据一致性和可用性,规避风险,确保应用无忧。

对于政府等行业的涉密数据,跨广域的传输安全就成为了介于终端安全和存储安全之间的关键一环。对此,H3C作为网络、安全、存储一体化解决方案厂商,不仅仅通过防火墙、IPS/IDS的部署、访问控制、网络隔离等方式,来确保数据的接入安全,同时,用户在数据传输时,还可通过存储设备或专门的传输加密设备,进行数据加密解密处理。即便广域网传输时发生数据泄漏,也可保证数据不被非法访问,全面确保数据的存储安全。

结束语

目前,H3C拥有的 IX3000万兆存储系列、IX1500中低端存储、IV5600虚拟化管理等产品,均能支持基于IP的网络复制技术,并且不同系列之间可做功能联动。大量实际应用证实了H3C基于IP的复制技术延长了灾备半径,满足了不同业务的灾备需求,并保障灾备数据完整可用,得到众多用户的检验与认可。例如在国土资源部、黑龙江电力、辽宁省交通厅、吉林省财政厅、安诚保险等业务系统中,均采取2M-10M的链路带宽,即能满足跨远程链路的灾备需求。随着灾备应用的深入,H3C基于IP的复制技术也将在更多应用中发挥出更多价值。