上讯信息王炜:五年CDM耕耘,将“数据用好管好”这件事做到极致

著名作家斯宾塞·约翰逊曾经说过“唯一不变的是变化本身”。对于本就快速迭代、日新月异的ICT信息技术来说,这次变化称得上颠覆式的革命性变化,在新的数字创新浪潮的席卷下,数据正在替代CPU计算成为IT系统新的核心,资源要围绕数据转而不是围绕CPU转,数据的重要性已达到前所未有的高度。

如果仔细来分析数据,从用途上来划分可分为生产数据以及辅助类数据。前者满足业务需要,后者则用于辅助决策、开发、测试以及容灾、备份的需求。与此相对应的是,提供存储技术支持的系统也可以进一步区分为主存储和第二存储。前者是大家熟悉的全闪存阵列以及云存储,强调性能、可靠性、稳定性等,后者以CDM(上讯信息敏捷数据管理平台ADM产品)为主,主要强调容量、容灾和开发、测试、数据分析以及数据安全使用(脱敏)。

对于行业企业来说,数字化转型、数字经济创新,更多的考验还是来自于第二存储所带来的挑战,比如海量数据快速交付、数据合规管控等等。由于早先应用认知上的缺乏,没有进行集中有效的统一管理,不仅效率低下,安全得不到保障,管理成本也居高不下。

上讯信息数据安全产品研发部高级产品总监王炜(右)和DoIT总编宋家雨(左)

但是情况也在快速发生变化,按照上海上讯信息技术股份有限公司(以下简称“上讯信息”)数据安全产品研发部高级产品总监王炜的判断:CDM“爆发”阶段,就要到来了!

DoIT总编宋家雨为此对王炜进行了专访。

ADM产品中标喜讯频发

在金融、电信领域,上讯信息敏捷数据管理平台ADM(以下简称“上讯ADM”)近来喜报频传,这是找到市场的突破口了吗?

宋家雨:近期看到上讯信息公众号发布了不少ADM产品中标的喜讯,请您谈谈相关情况。

王炜:上讯ADM产品越来越受到行业客户的关注与青睐,近期若干家大型城商行及其他金融机构在通过严格的POC测试后招标选购了上讯ADM产品和服务,这是对我们产品在CDM领域应用的高度认可。

如今国家从陆续出台新的政策法规上升到了法律的高度,对数据安全、数据生命周期等相关业务的应用管理要求更高,监管更严。金融行业更是采取了相对更为严格的管控机制,上讯ADM产品的数据全生命周期管理的理念以及功能,很好的满足了相关应用的要求,可为测试开发工作快速准备数据,从而推动用户满足于新一代数据使用和管理的需求,这也是推动ADM应用需求的重要原因。

宋家雨:我想了解一下ADM主要解决了用户哪些问题或者痛点?它有哪些主要的功能?

王炜:通过与包括金融、运营商在内的用户座谈,我们了解到用户目前在开发工作中的痛点主要包括:针对应用开发、QA、用户验收、产品支持、报告和备份等。从生产数据源创建8~10份数据副本,以一个5TB的生产数据库为例,往往要为下游创建出40~50TB的数据副本,如今用户常常拥有超过上百套生产数据库,如此计算,数据副本就达到了PB级的规模,不可避免的带来了海量数据存储和数据维护管理的需求,用户不堪重负。

不仅如此,在传统生产协作流程中,当开发和测试人员想要获取数据副本时,从需求申请提交到准备好系统环境,往往会耗时几天、甚至按月来计算(视数据规模、环境准备情况等而定)。

如此应对和处理海量数据并非最佳!

不仅大量浪费了存储资源,还带来了数据合规和敏捷性等方面的问题,影响了用户应用程序的快速迭代,这对于今天追求敏捷转型和DevOps转型的用户而言难以接受。

为了帮助用户统一集中管理这些海量的非关键性数据,尤其是冗余的数据副本,CDM技术应运而生。

上讯ADM产品就是CDM技术的典型应用。它的主要功能大致包括:

第一, 生产数据备份;

第二, 备份数据有效性验证;

第三, 数据脱敏;

第四, 测试数据的极速交付;

第五,数据访问权限管理;

第六,数据库审计。

宋家雨:CDM技术在业界提出几年了,它和传统的备份有什么区别?能否取代备份?

王炜:备份是CDM获取数据的一种方式,新建业务系统的数据备份直接用CDM来做是比较合适的,可以在实现数据备份的同时盘活备份数据。如果已经部署了备份系统,CDM可以实现备份数据的自动恢复校验,与备份系统形成互补。

传统备份技术是将数据恢复后交付使用,恢复的过程很长,而CDM保存的是原始格式数据,可以直接交付使用。相比备份,CDM更加关心的是数据的交付使用与管理

数据备份是CDM获取数据的一种方式,新建系统采用CDM方式进行数据备份、数据交付、数据脱敏、数据管理,是比较好的一种选择。对于已经建设了备份系统的用户来讲,希望看到的是CDM与传统备份的互补、并存,因此CDM的另一种数据获取方式(备份数据管理)正好可以实现互补。

近几年,CDM产品在国外的应用已经较为普及,不仅限于备份,在开发、测试、数据分析等领域都得到了广泛应用。

国内在近两三年中也不断的有国内企业投身到这个赛道,但一些企业的产品本质上是备份产品,这类产品与CDM技术还是存在着较大的区别。简单的说,备份从根本上是作为数据的保底存在,一旦发生物理或逻辑故障,可以为用户提供灾难恢复。而CDM侧重于对数据的生命周期管理,是牵涉到用户数据获取、数据存储、数据使用的全流程的生产力工具。

宋家雨:Gartner在2020年存储和数据保护技术成熟度曲线中,预测CDM将在未来5~10年进入“实质生产的高峰期”,CDM目前在国内外的发展状况如何?

王炜:过去的十多年时间,CDM的厂商主要分布在北美,包括像Actifio、Cohesity、Rubrik等公司,在技术趋势上,逐渐走向跨数据中心和混合多云的数据管理,满足用户利用数据副本进行价值利用,以及安全合规的需求。

而国内,近两年CDM技术在金融和运营商这两个行业获得了蓬勃发展,已经开始在测试环境、准生产环境乃至核心生产环境部署CDM技术,满足数据敏捷使用和数据安全管控的需求。并且金融和运营商两个作为对数据安全合规性要求极高的行业,他们对CDM技术的应用能够起到示范引领的作用,带动其他行业对CDM的采纳。

在法规遵从上,包括像今年国家医疗保障局《关于印发加强网络安全和数据保护工作指导意见的通知》,以及最近的《数据安全法》,对数据的全生命周期管理都提出了要求,这将促进CDM技术获得更广泛的应用。

新赛道耕耘

在CDM这个新赛道上,上讯已经耕耘了多年,心得与体会。

宋家雨:我们知道上讯早在2016年底就发布了CDM的成熟商用产品—敏捷数据管理平台(ADM),从一家专注网络安全领域的公司到切入CDM数据管理这一新赛道,可否介绍一下贵公司有基于哪些方面的考虑以及这5年多来在此领域,人员、技术储备、研发的投入情况?

王炜:数据作为信息时代的石油,我们极其看好这条赛道的前景。经过多年的行业实践,我们也看到了企业在数据副本管理上的一些痛点:比如说效率的问题,数据交付慢,有时候一份数据从提出申请,准备环境到交付使用,久的话需要1~2个月时间;成本的问题,数据存储成本和人力成本都居高不下;以及数据安全的问题、权限管控的问题、备份数据缺少利用的问题等等……

从2016年底发布,经过近5年的潜心打磨,将多年的安全优势结合CDM技术,上讯ADM产品无论是功能的丰富性、产品的稳定性,还是对用户业务场景的理解,可以说在国内这个细分领域都是遥遥领先的。

在实践中,上讯ADM产品也开始逐步将备份、数据交付与管理、数据脱敏等功能进行融合,基于端到端的流程自动化和数据集中管控,真正帮助用户实现了数据价值的利用。

面向未来,上讯信息初心未改,那就是把“数据用好、管好”这件事做到极致。

宋家雨:ADM的交付形态是纯软件还是一体机?部署的地理位置除了本地数据中心,可以支持公有云吗?

王炜:上讯信息是一家软件公司,ADM是其研发的具有战略意义的软件产品,可以纯软件方式交付部署,也可以以一体机的方式交付部署,交付方式比较灵活。

ADM支持公有云部署,我们在某国内大型运营商总部的项目,就是部署在华为云、电信云、联通云三朵云上的。

宋家雨:ADM对结构化数据和非结构化数据都可以支持吗?

王炜:目前主要的应用场景是结构化数据,后续也会根据用户的需求,支持非结构化数据。

宋家雨:在数据的获取上,支持哪些方式?

王炜:支持的数据获取方式比较丰富,在用户已经有备份系统的情况下,支持从现有的备份系统获取数据;也可以从生产环境实时获取数据,还可以自助上传脚本备份的数据等多种方式。

影响、变化和挑战

都知道机遇和挑战并存,但要把握并不容易,有市场因素,如观念和习惯,也有未来技术的冲击,如容器/云原生、信创等技术的影响。

宋家雨:ADM和容器的结合对用户会不会是一个不错的解决方案?

王炜:确实是这样。容器技术相比传统虚拟化技术更轻量、更容易实现动态迁移和设置,以及从开发到生产更快速等诸多优势,利用容器可以迅速的把应用环境搭建起来,而上讯ADM产品则可以快速交付所需数据,从而加速应用环境的交付使用。

宋家雨:我们目前主要的应用行业和应用场景是什么?为什么会做这样的侧重?

王炜:主要的应用行业是金融和运营商,应用场景比较多的是开发测试场景。这两个行业一是数据量大,二是对数据的利用有比较多的需求,三是对数据的安全合规要求较高。随着《数据安全法》的出台,越来越多的行业会注重对数据生命周期的安全可控管理,医疗、教育、媒体、政府这些行业未来都有可能加大对CDM应用的投入。

宋家雨:您认为ADM这款产品最大的竞争优势或者说它的“护城河”是什么?

王炜:目前市场上一些厂商强调数据的获取能力,在产品形态上更偏向备份产品。而对于上讯信息而言,备份只是其中的一种数据获取手段,在数据获取环节既可以通过用户既有备份系统内获取数据,也可以通过从生产环境实时获取数据,又或者用户以脚本的方式自助上传数据等多种方式。上讯ADM产品还是以CDM技术为核心,实现了从数据获取、数据存储、数据构建、数据使用、数据归档到数据销毁的数据全生命周期管理

宋家雨:可否介绍一下目前有哪些应用案例,通常的部署规模大概是怎样的?用户复购情况如何?

王炜:中信银行、中国铁塔、上港集团、财通证券、华泰人寿等等,主要是金融和运营商行业的高价值用户。用户一开始可以从小规模,几个节点开始,因为这个产品确实解决了他们很多数据使用和管理的问题,产品的用户粘性特别高,会不断的扩展节点规模,以满足更多场景和更大规模的使用需求,客户的复购率就会特别高,大部分用户都做了项目二期,有些用户已经完成了项目三期。

宋家雨:这款产品未来的演进方向是如何考虑的?

王炜:从部署的地理位置上来讲,未来可以支持跨越本地数据中心、边缘和多公有云,安全地提供备份、恢复、分析、合规性以及数据的快速交付与管理;从流程上看,可以更加无缝连通数据的全生命周期安全统一管理;从功能上来说,则是上讯ADM产品与垂直应用场景的紧耦合,强关联。例如,在开发测试场景下,能否基于一套数据平台,跑通所有的开发测试作业,而无需额外使用第三方平台,比如测试版本控制,以降低额外的资源消费,提高开发测试效率。

宋家雨:上讯ADM产品适配信创吗?

王炜:信创是国家一项重要的发展战略,也是当今形势下国家经济发展的新动能,在此发展战略的大环境下,2020年,“新基建”已全面启动,各地信创项目开始大面积铺开,信创产业逐渐发展成为行业的现象级风口。上讯信息作为坚持自主研发、产品安全可控的国内企业,势必会积极响应并组织力量做好相应工作。

上讯ADM产品主要应用市场对应在金融及运营商行业,这两个大行业在应用中对业务连续性和稳定要求压倒一切,尤其在基础软硬件层面,一直以来是国际厂商的核心技术产品占据垄断地位。而信创涉及基础架构到应用架构,各级改造存在潜在风险,安全稳定责任风险重大,导致这两个行业信创整体要求高、难度大。

上讯ADM产品目前已经取得在用户环境中实际兼容适配的国产数据库包括巨杉、星环、GoldenDB、OceanBase、浪潮,其他国产数据库及操作系统也在持续兼容。

上讯信息面对信息化变革带来的机遇和挑战,将投入更多资源到应用技术创新、核心技术创新中,积极践行创新驱动,推动国家信息安全的科技发展。