浪潮公司存储解决方案--如何选择容灾方案

    容灾方案的重要性和多样性


    随着信息化建设的高速发展,用户的业务系统也越来越依赖数据中心的服务支持。信息数据甚至已经成为了企业发展的命脉,数据安全的重要性也不言而喻。在信息化建设的初期,传输网络和处理能力是我们关注的重点;而现阶段数据的安全性已经成为了数据中心建设的首要考虑因素。


    现有的很多技术手段可以保证数据中心内的数据安全和系统可用性。例如RAID技术、高可用系统、数据备份等等,这些技术都在数据中心范围内保障数据安全和系统可用性。但当数据中心遭受灾难时这些措施就无能为力,所有的应用和数据都会遭到损坏,系统将遭受难以估量的损失,对企业的经营活动产生巨大影响,甚至会造成企业的倒闭,此类案例多不胜数。这些教训使人们更加重视整个数据中心的安全性和应用可持续性。容灾方案就是用于解决数据中心的安全性和高可用性,保证在数据中心遭受灾难时可以有灾备中心继续提供数据应用服务,使各种业务应用保持正常运转。


    近几年来,容灾已经成为信息数据中心建设的热门课题。很多容灾技术也快速发展起来,对用户来说也有很广阔的选择余地。但由于容灾方案的技术复杂性和多样性,一般用户很难搞清其中的优劣以确定如何选择最适合自己状况的容灾解决方案。本文就各种容灾方案和如何选择合适的容灾方案做一个初步探讨,希望能对数据中心容灾建设提供一些参考。


    容灾方案的分类


    目前有很多种容灾技术,分类也比较复杂。但总体上可以区分为离线式容灾(冷容灾)和在线容灾(热容灾)两种类型。


    所谓的离线式容灾主要依靠备份技术来实现。其重要步骤是将数据通过备份系统备份到磁带上面,而后将磁带运送到异地保存管理。这种方式主要由备份软件来实现备份和磁带的管理,除去磁带的运送和存放外,其他步骤可实现自动化管理。整个方案的部署和管理比较简单,相应得投资也较少但缺点也比较明显:由于是采用磁带存放数据所以数据恢复较慢,而且备份窗口内的数据都会丢失,实时性比较低。对于资金受限、对数据恢复的RTO(目标恢复时间)和RPO(目标恢复点)要求较低的用户可以选择这种方式。


    在线容灾要求生产中心和灾备中心同时工作,生产中心和灾备中心之间有传输链路连接。数据自生产中心实时复制传送到灾备中心。在此基础上,可以在应用层进行集群管理,当生产中心遭受灾难出现故障时可由灾备中心自动接管并继续提供服务。应用层的管理一般由专门的软件来实现,可以代替管理员实现自动管理。由上面分析可见实现在线容灾的关键是数据的复制。数据的复制有多种实现方式,也是各有利弊,后面我们深入讨论。


    由于在线容灾可以实现数据的实时复制,因此数据恢复的RTO和RPO都可以满足用户的高要求。因此,数据重要性很高的用户都选择这种方式,比如金融行业的用户。但要实现这种方式的容灾必须有很高的投入,一般中小型企业用户很难负担。在方案选择时一定要结合多方面的因素考虑。很多的用户在初期规划时都过于追求完美,对RTO和RPO要求过高,并不考虑自身的经济承受能力,导致最后的预算无法负担。所以选择容灾方案一定要结合自己的实际情况,并不一定要求无数据丢失,只要能确保在业务的可承受范围就可以了。


    数据复制的三层实现方式:



    数据复制的技术也有很多,从实现复制功能的设备分布可大体分为三层。分别为服务器层、存储交换机层和存储层。(见上图)


    服务器层的数据复制


    在生产中心和灾备中心的服务器上安装专用的数据复制软件以实现远程复制功能。两中心间必须有网络连接作为数据通道。可以在服务器层增加应用远程切换功能软件从而构成完整的应用级容灾方案。这种数据复制方式相对投入较少,主要是软件的采购成本。兼容性较好,可以兼容不同品牌的服务器和存储设备,较适合硬件组成复杂的用户。但这种方式要在服务器上运行软件,不可避免的对服务器性能会有影响,选择的时候请相对注意。


    交换机层的数据复制


    存储交换机技术的发展使得交换机可以实现更多的功能。很多原来由服务器和存储实现的功能现在也可在交换机层实现,比如存储虚拟化。同样,现在有些厂家的交换机产品已经可以实现复制功能。在生产中心和灾备中心都要部署这种交换机,并在交换机之间通过专用链路连接起来。由于交换机可以管理和复制的数据是存放在存储层内的。因此,用户需要将生产数据都存储在交换机所连接的存储设备中,这样就可以实现交换机对数据的管理和复制。目前使用这种技术的产品还不是很多,成熟性还有待提高,具有这种功能的交换机价格也相对较高,所以采用这种方案的用户比较少。


    存储层的数据复制


    现在的存储设备经过多年的发展已经十分成熟。特别是中高端产品,一般都具有先进的数据管理功能。远程数据复制功能几乎是现有中高端产品的必备功能。要实现数据的复制需要在生产中心和灾备中心都部署1套这样的存储系统,数据复制功能由存储系统实现。如果距离比较近(几十公里之内)之间的链路可由两中心的存储交换机通过光纤直接连接,如果距离在200公里内也可通过增加DWDM等设备直接进行光纤连接,超过200公里的距离则可增加存储路由器进行协议转换途径WAN或INTERNET实现连接,因此从理论上可实现无限制连接。在存储层实现数据复制功能是很成熟的技术,而且对应用服务器的性能基本没有影响。在应用层增加远程集群软件后就可以实现自动灾难切换的整体容灾解决方案。目前这种容灾方案稳定性高、对服务器性能基本无影响,使容灾方案的主流选择。


    目前来看容灾系统建设的成本投入还是比较可观的。用户在选择容灾方案的时候一定要结合自己应用环境和预算等实际情况做出决定,适合自己的才是最好的。