大数据时代的数据保护趋势谈

当前,数据正在成为企业用户重要的资产而存在,又因其超大量、高流速、种类多样和不确定性的特点,数据特征的改变速度已经超越了处理技术,为此,步入大数据时代后,企业用户如何将数据存得更好、获得更有价值的保护?大数据保护是否需要和应用相结合,如何体现数据保护的先进性和自动化特点,需要对企业人员、流程、技术等做全方位考虑吗?一系列的问题都已成为业界大数据保护所讨论的重要话题。

大数据来袭 数据保护迫在眉睫

百度百科中显示,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” “大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。

既然当前大家对大数据如此聚焦,来自IDC的多组数据表明,全球产生的数据量在以几何倍的增长,而到了2020年,全世界所产生的数据规模将达到今天的44倍。对于数量如此巨大的数据,以非常惊人的速度不断产生,新技术的出现也在继续加速数据产量,我们首先要考虑的就是如何将这些数据存好、保护起来。对于企业用户来说,每天产生的业务数据已经成为企业的资产,其重要性可见一斑。那么大数据变化的大环境下,如何考虑企业用户的数据保护问题成为当前关注大数据发展的所有业内人士讨论的焦点之一。

现实中,企业用户的数据也是流动的。大家在强调提升存储效率的同时,还需要对数据保护做出更为明确的定位。不过,在通过各种资料搜集分析整理发现,企业用户在大数据时代也面临几大现实问题:一是恢复时间目标(RTO)变的更加咄咄逼人,同时运维的挑战成倍增加;二是整个存储架构特别复杂;三是传统备份需要花费大量时间;四是传统的备份设备是否可以有效保护虚拟化环境数据;五是企业用户大部分准备恢复一切数据或任意数据,包括整个数据中心、一个关键应用或者一个邮件。

针对这些非常现实而又重要的问题,在考虑大数据保护的同时,对企业用户需要保护什么样的环境做准确的定位和分析,比如生产数据存放在企业级的SAN存储上、需要被磁带保护的数据、快速增长的物理或虚拟化环境、多平台的服务器和应用环境,不同的环境,其数据保护策略肯定有所不同。即便是这样,戴尔仍然提出了非常实在的数据保护观点,戴尔(中国)高级存储专员白云强调说,首先数据保护策略需要和应用价值相结合,也需要对人员、流程、技术等做全方位考虑,也包括对最小化数据的抓取、移动、存储与保护的综合考虑,当然也会涉及到一些标准、整合以及统一的架构问题,再者需要提升数据保护的自动化与先进性,增加具备自我保护的存储设备与之对应。

不同环境的数据保护策略分析

既然我们需要对大数据保护的存储环境有所考量,那么可以从刚才提及的几个主要的环境来进一步的分析。

通常情况下,大家谈及比较多或者说最为常见的就是在企业级SAN 存储环境上,戴尔强调充分利用内置的数据保护功能保护生产数据。当然对于选择这种SAN存储架构来说,其优势还是容易理解的,它的单一界面管理在线存储和数据保护,并且还可以在集成操作系统、应用平台以及虚机管理平台的同时,也集成具备远程容灾的数据复制功能。在这里,大家应该常见到Dell EqualLogic 和 Compellent,前者是简单灵活的虚拟化统一IP-SAN架构,后者具备自我优化、领先的企业级多协议SAN架构。需要指出的是,在针对这种SAN环境下,DELL EqualLogic 和Compellent可以提供先进的保护功能,但是需要和长期数据保护方案相结合,实现完善的数据保护。

实际上,在戴尔看来,EqualLogic 本身就具备非常突出的特性。从DELL官方资料就可以很容易了解到,EqualLogic内置了包括快照,复制,应用保护等软件许可,并与和SQL、Exchange& SharePoint、 Windows and Linux file systems、Windows 以及VMware hypervisors等集成。EqualLogic也非常重视数据保护能力的提高,注重对物理设备、VMs、应用和整个数据中心的保护,避免传统磁带对单一文件和对象的漫长恢复流程,加强自动化和低成本的容灾恢复。

这里,我们可以从两个部署场景来分析EqualLogic的数据保护策略。

一是针对第一层应用的数据保护,EqualLogic通过Auto-Snapshot Manager/ Microsoft Edition (ASM/ME) 提供对SQL、Exchang、 Hyper-V和 SharePoint等应用感知的智能拷贝。ASM可以确保所有farm变化都被保护,并且自动检测常规变动,例如新的主机和新的数据库,自动提醒管理员时间表的最新更新。通过一个界面管理所有主机和多个farm,智能拷贝通过快照和复制保护特点时间点的应用。EqualLogic和SharePoint 集成力求实现高效管理、性能优化、加速备份和恢复、轻松使用这些企业用户所渴望的目标。

二是针对文件到整个数据中心多层保护,对于数据中心,Auto Replication 可以实现全面灾难恢复;对于物理架构,冗余硬件和同步复制对于硬件环境提供99.999%的高可靠性;对于虚机,和hypervisors集成保护虚机环境;对于应用数据,Auto-Snapshot Manager 保护应用数据。

对于戴尔高价收购的Compellent 来说,有着很有意思的特性,它内置数据保护架构,Instant Replays (snapshots) 和replication 可以和多种应用和操作系统集成,其自动分层存储技术颇为业界所关注。在之前的文章《自动分层存储带给用户新价值》有所介绍。

但是,Compellent如何提高保护能力?它可以通过在不牺牲数据保护SLAs的情况下,满足更低的存储和带宽需求,支持各站点的异构配置,没有传统的复杂性和高成本,提供先进的数据保护能力。


Point-in-time copies (Replays)

对于Compellent 应用场景分析可以从三个方面着手,一是针对在本地数据中心的连续数据保护。Compellent本身带有的Data Instant Replay功能可以按照所需频率创建回放点,没有传统的比例限制。Compellent时间点的拷贝卷可以帮助管理员在秒级快速恢复任意大小的逻辑卷,而没有传统存储系统的限制。Compellent高效的设计允许在没有大量空间消耗的情况下,创建更多回放点。而Compellent数据分层技术确保所有回放点都自动迁移到底成本的硬盘中。这些Compellent带来了数据保护的很多好处,时间点拷贝帮助用户实现RPO要求,也帮助防范病毒、停电和人为错误对数据的危害,在单一界面内实现基于向导的回放点创建、组织和恢复。

二是利用 Compellent Live Volume安排计划内停机,同时针对计划或非计划停机,提供丰富的数据保护功能。关键数据可以简单方便地迁移到另一个站点的存储上,迁移数据同时业务不中断,要求实时在线。这是真正意义的业务连续性方案,无需额外硬件支持。也可以确保虚拟服务器数据的高可用性,包括 VMware、 Hyper-V and Citrix XenServer。并且通过一个管理平台可以管理所有共享卷。

现实中,Compellent Live Volume可以实现系统管理员主动将一个卷从一台Compellent系统上迁移到另一台Compellent中,而应用无需中断,要恢复正常操作,系统管理员可以逆向 Live Volume 迁移流程。

三是针对多站点灾难恢复的应用场景,Compellent可以凭借极有竞争力的价格提供多点容灾复制功能,包括精简复制极大降低存储要求和网络带宽;以IP连接为架构的复制技术,方便管理和实施;企业管理器可以使用统一界面,同时管理生产站点和容灾站点的Compellent设备。


Compellent具备的 Thin Replication功能,可以跨越多站点实现轻松复制,支持多种应用以及集中管理。

重复数据删除在数据保护中的作用

重复数据删除依然还是一个比较受用户重视的存储技术,也被用户普遍认可,业界专家指出重复删除技术可以为用户带来许多实际的利益,包括满足ROI(投资回报率,Return On Investment)/TCO(总持有成本,Total Cost of Ownership)需求;可以有效控制数据的急剧增长;增加有效存储空间,提高存储效率;节省存储总成本和管理成本;节省数据传输的网络带宽;节省空间、电力供应、冷却等运维成本。

不过,大家常见文件重删和块数据重删,但戴尔的DR4000采用了块重删方式,帮助用户提高数据保护效率。相比磁带备份系统,DR4000极大降低复杂性和管理成本,它也采用了简单高效的磁盘备份架构,避免对现有的数据保护流程做重大更改。实际上,Dell DR4000 数据重删应用是目标端消重设备,可以轻松部署在现有备份环境中。


无缝嵌入现有备份环境

相比于文件重删,块数据重删优势也比较明显,比如一个10MB文件同时发给10个销售人员,每个人都对这个文件做了很小的修改,那么文件级的数据重删技术需要同时存储10份拷贝、100MB数据,而块数据重删技术仅仅保留一份拷贝10MB和更新的数据块就可以了。


在备份架构中轻松实施远程容灾数据复制

戴尔官方资料显示,DR4000同时支持重复数据删除和数据压缩功能,验证支持业界主流备份软件,包括AppAssure, NetBackup, Backup Exec, Veeam, EMC Networker, 和 CommVault Simpana等。因此,DR4000可以从更多的在线备份历史版本中迅速恢复数据,由于数据重删和压缩技术,远程备份数据复制极大降低网络带宽要求。

Quest 带来的专家级数据保护

大家应该还记得早在2010年,Quest收购BakBone并将BakBone产品的数据保护技术整合到其自身的数据保护产品中,包括vRanger Pro;LiteSpeed;Recovery Manager ;SharePoint;Active Directory;以及SharePlex。涵盖了虚拟化产品、数据库和应用级的数据领域。因此,收购BakBone又整合到戴尔大家庭之后,Quest完全可以为企业用户带来专家级的数据保护策略。

不过,针对快速增长的物理、虚拟或者混合环境,Quest正在提供新一代数据保护软件,其功能特性包括了设计部署快速、简单和可扩展的数据保护新架构和技术,实行颗粒度更精细的单一对象恢复以及 near-instant(近即时) 丢失数据恢复,先进的重删技术节约空间,降低成本。当用户的环境转变为虚拟或云架构时,这些软件工具可以补充到现有的数据保护策略中。

针对连续数据保护和快速恢复方面,AppAssure具备映像级快照的持续数据保护,适用于 Windows、Linux和虚拟化环境,包括 iQL、Exchange 和SharePoint等。也可以自动验证保护应用的数据完整性,还包括领先的重复数据删除和压缩技术。在帮助企业用户提高保护能力方面,AppAssure提升恢复点目标 (RPO) 到大约15 分钟 ,同时从根本上消除备份窗口,确保应用和数据的可恢复性,提供关键应用数据的瞬时恢复功能,实现高速、简单、规模化的保护虚拟化环境数据。

实际上,到目前位置,Quest vRanger是部署最多的Vmware环境数据保护解决方案,在全球有超过40000个用户正在使用这个解决方案。

Quest vRanger具备了独特的特性,可以和虚拟化环境紧密集成,提供变长的块级重复数据删除,以及单一通道恢复虚机和文件。在优化保护能力方面,为虚拟化环境提供多重保护机制,优化备份和复制数据,精细到文件级的恢复能力。

此外,戴尔集成企业级的备份软件保护多服务器和多应用环境数据中心,支持范围广泛的应用,、操作系统和存储设备。实现统一工具满足各种恢复要求、统一工具管理不同基础架构数据中心。这里面就是Quest NetVault Backup软件和Dell DL 2300数据保护一体机两个代表。

Quest NetVault Backup是可扩展的统一备份和恢复软件,保护企业级用户异构环境的数据和应用。具备多个特性,可以保护异构平台和应用和保护分散的企业存储平台,支持多种操作系统,应用环境和数据库,同时集成SAN架构和NAS架构存储,实现一键备份恢复应用数据。在提升保护能力方面,提供灵活选项应对复杂和快速增长的企业应用环境,利用固有的集中备份恢复架构提供整体数据保护方案,快速应用数据恢复。

Dell DL 2300是大家所熟知的强大的数据保护一体机,预置CommVault Simpana 备份软件和磁盘库。对于这么一个软硬一体包含磁盘库的设备,在出厂时候,就预置企业级的CommVault Simpana备份软件,支持数据重删和归档,并且集成SAN架构的快照。在提升保护能力方面,做到无缝部署和管理企业级备份环境,减少备份容量需求,降低容灾复制带宽要求。(阿明)

综上所述,在面对大数据时代的数据保护多样化的环境下,Dell 数据保护解决方案主张简单、灵活、稳定的思路,在降低风险、节约时间和消减成本方面有着非常独特的优势。特别是集成传统和创新的数据保护方案,从客户端到企业云中心,全方位确保企业应用、数据、服务的安全、稳定与可靠。简化管理,内置自动化和智能化功能,多平台集成,确保解决方案开放、高效、灵活、优化。与此同时,其自我保护的数据保护产品和方案最大限度优化数据管理。为此,企业用户可以从中选择存得更好、获得更有价值的数据保护方向与策略,以此获得在大数据时代数据保护与时俱进的效果。