第四届双态IT北京用户大会:云信达张兵演讲实录

2021年6月5日,双态数据基础设施建设峰会在北京召开,本次大会汇聚超过300位部委、央企和金融等行业用户,交流探讨双态数据基础设施建设的管理实践经验。

云信达创始人&CEO张兵先生作为双态IT联盟成员单位代表,发表主题演讲《CDM副本数据管理对大型金融机构数字化转型的意义》,以下为演讲实录:

数字化时代企业需要拷贝操作系统(Copy Operating System)

一、从信息化走向数字化,数据连接应用成为核心问题

在信息化时代,企业从单个信息系统的建立,到逐步形成庞大的互联网数据中心,信息系统帮助企业完成了信息化转型,实现了人通过信息系统的协作。因此,信息化时代的特点是:应用连接人。

进入数字化时代,各种类型的企业应用(Apps)如雨后春笋般生长出来,充斥着每个人的终端屏幕。而应用是围绕着数据展开的,正如Gartner在描述最新的数据技术趋势时采用的下面的一张图:从采集数据到连接应用,企业已经进入数据连接应用的时代。数据成为企业最核心的生产要素(而非应用),怎样解决企业数据连接应用的问题将成为企业数字化转型的核心问题。

图 1 Gartner:从Collect到Connect

二 、拷贝是数据的共性,拷贝(副本)数据是数据管理的理想目标

数据的形态结构千变万化,没有常形,描述数据且与形态结构无关的手段是拷贝(Copy动词),拷贝(Copy名词)是各种异构数据的共性。数据产生和变化的源头是生产交易系统,计算机处理数据的交易逻辑(随机增、删、改、查)和管理逻辑(批量统计、检索、格式化、标签化)差异巨大,必须分开,记录数据产生和变化的拷贝数据(副本)成为处理数据管理逻辑的理想目标。

经过“清洗数据”形成的分析型数据管理平台(数据仓库、大数据或数据中台)不符合法律上的“可解释性原则”,失去了合规属性。从合规的角度,“拷贝”优于“清洗”。

三、拷贝(副本)数据管理(Copy Data Management)是企业实现数据连接应用的第一选择

拷贝(副本)数据泛滥已经成为不争的事实,Gartner推出 “第二存储(Secondary Storage)” 新概念正是把“企业使用二级数据和应用像使用智能手机一样简化”作为美好愿景。我认为第二存储的概念太硬,拷贝操作系统COS(Copy Operating System)是构筑拷贝(副本)数据管理(Copy Data Management)的软件平台。CDM(包含第二存储和拷贝操作系统)将为企业实现数据连接应用、加速数字化转型提供数据管理底座。

CDM——从“备份革命”到云数据管理

数据脱离生产环境的第一拷贝(first copy)是“数据备份”,备份系统的原始定位是:从数据产生的源头记录数据在时间维度上产生和变化的状态,用于恢复及合规保存。自IT诞生之初数据备份就成为系统架构必不可少的基础组件,企业不能承受数据丢失和逻辑损坏之重!因此,数据备份一直以来被认为是数据保护的最后一道防线。

在数字化转型的前夜,数据备份面临尴尬。一方面承载着企业全生命周期的第一手数据资产;另一方面,由于技术的限制,备份数据沉睡,沦为“暗数据”。数字化转型对企业数据要素管理、数据驱动业务提出了刚性的要求,“暗数据”既消耗企业的成本又无法满足数字化转型的要求,企业花了大价钱建立的备份系统仅仅是为了“以防外一”用来恢复。数字化转型势在必行,企业何去何从?——答案就是盘活暗数据。

Gartner 2016年在《CDM加速双态IT》一文中提到了一项新技术:CDM(Copy Data Management)即拷贝(副本)数据管理,定义了CDM的三个基本特征:一、原格式拷贝;二、黄金副本;三、虚拟副本服务。原格式拷贝迭代了传统备份技术用到的备份集方式,通过原格式拷贝可以得到数据的“黄金副本”,黄金副本可见可用,而备份集却只能通过费时费力费钱的再存储过程(restore)才能打开。原格式和黄金副本颠覆了传统备份的“备份集”,盘活“暗数据”,是即将开启的备份技术革命。

虚拟副本服务是造就CDM新高度和未来走向的关键特征。如果说“原格式”和“黄金副本”的出现是备份革命,那还只是停留在数据保护基础设施的范畴。黄金副本是企业的第一手数据资产,可以用于恢复或还原生产数据,既使黄金副本是可见可用的“活数据”,从合规的角度,我们也不能篡改“资产”。

数据的可见可用是通过虚拟化的方式(Virtual Copy)呈现,拷贝(副本)可以被无限虚拟,生成N个副本挂载(live mount)给不同的应用场景。云计算环境可以对虚拟副本进行自动化的管理和编排,以服务的形式连接并赋能应用。对IT元素进行虚拟化处理变成一种服务是云计算的基本特征,于是,CDM从数据保护基础设施演变为云数据基础设施,从单纯的运维工具演变为业务平台,从信息化基础设施演变为数字化基础设施。

CDM集上述三个特征于一体,拉通数据保护、数据管理和数据服务,既有数据保护的稳重,又有数据服务的敏捷,是稳态IT和敏态IT的交集和纽带(Gartner:CDM加速双态IT)。CDM的另一个新名字——云数据管理(Cloud Data Management)就是对CDM成为未来云数据基础设施的预言。

CDM副本数据对大型金融机构数字化转型的意义

ITSS 33136标准定义了企业IT三个能力域:求生存、求发展和组织协调,对应了金融机构的运行维护、业务开发和管理职能。

大型金融机构数字化转型的痛苦来自技术和组织的变革。目前数据管理的实际情况是:管理数据的看不见数据(数据管理部),看得见数据的没有处置权限(运行维护),需要用数据的在等数据(业务开发)。推倒横亘在企业三个不同的能力域之间的部门墙需要技术和组织变革,协作平台、连接标准和敏捷的技术手段可以成为催化剂,降低化学反应的门槛,加速变革,减少痛苦。

以拷贝(副本)数据为连接标准,建立一个协作平台,打通组织内部的数据资产管理和敏捷数据服务。在稳态系统通过数据保护得到全生命周期的原始数据资产,呈现给数据管理部门方便进行可视化管控,业务开发部门可以从平台上合规地、敏捷地取得数据,使用数据。下图的圆盘就是云信达对CDM的完整画像,什么时候圆盘转起来了,企业的数字化转型就加速了!

大型金融机构在数字化转型的时候都要面临现实的抉择:反复新造轮子还是给基础组件插上数字化的翅膀?无论是过去还是未来,金融企业都不能承受缺失数据备份之重!而数据备份这个基础组件正在不可逆地走向CDM,成为数字化时代的数据管理底座。

最后我们来看几个案例,六大国有银行历史最悠久的交通银行、中国最大的地方性银行——广东农信、中国最大的城市商业银行——北京银行,这几家都是各自行业的引领者,面对数字化转型的压力主动寻求改变。这些企业敏锐地意识到沉没在备份体系的数据对数字化转型的价值,主动拥抱CDM新型技术路线。

面向数字化转型的信息技术应用创新,绝不是导致消费降级的替代,传统数据备份的规划和建设模式不应再持续,CDM实现数据资产全生命周期管理,以拷贝作为数据的共性连接企业稳、敏双态IT各能力域,提升企业数据连接应用的体验,加速企业数字化转型。