TiDB 在保险行业关键场景的探索与实践

8 月 24 – 26 日,“中国财险科技应用高峰论坛”在北京召开。 PingCAP 副总裁刘松在大会中分享了主题为《TiDB分布式数据库在保险行业关键应用场景的探索与实践》的演讲,从财险核心场景创新,到基础软件行业趋势做了深入分析,并结合保险数字化趋势,展望了保险数字化未来的可能性。

新技术环境:“开源+云”的互相推动与演进

过去 20 年,从互联网创新到数字化,背后有着两个重要趋势:一是“开源”,二是“云”。其中,开源经历了几个不同的发展阶段。第一代开源是 90 年代以 Linux 为代表的的开源运动,主要是对抗闭源软件;第二代开源是 2000 年代,所有移动互联网公司的数字平台都开始采用以开源为主的技术栈。这个时代中,从互联网技术栈中产生了一种重要的 IT 服务形态——云计算;到 2015 年后,随着云计算的 IaaS 层规模越来越庞大以及多云、云原生的兴起,开源也进入了第三代。 新一代的开源已经不是互联网公司自己家里的开源,而是每一个用户都在用的开源。最重要的软件技术都已经变成原生开源为主的,再结合云计算 2.0 服务形态,形成了“开源+多云”的技术生态。今天,我们正处在开源 3.0 和云计算 2.0 结合的早期阶段。

从现在开始到 2030 – 2035 年间,全世界最重要的基础软件技术将多数来自开源项目,如新一代的 Sa人工智能、物联网、区块链、低代码、云原生等技术的源头都将是开源,构成了一个个技术引擎。而云计算就像“组装汽车”,可以把好的开源技术引擎组合成云服务交付给用户。开源打造“引擎”,借助云组装成“汽车”,帮助每一个客户更容易走向自己的数字化旅程。这三者形成了一个数字化创新三角,所有技术都会被“开源、云”这两个关键技术重新塑造,这也是未来 10-15 年整个软件行业的主导形态。因为这个大三角的技术环境,今天的数据库和 20 年前的数据库已经有了天壤之别。20 年前,数据库还主要是信息化的交易系统,而今天的数据库既能解决交易系统问题,又要解决大数据分析问题,还要和云厂商结合做云原生的创新,以及通过AI更快的发现数据的价值。在这一趋势影响下,有分析机构预测,未来 5 年所有行业的数字化创新速度,会是过去 10 年的 5-10 倍。

TiDB :融合开源和云两个生态的价值

TiDB 是 2015 年创立的全球性开源项目,它处在第三代开源时代起始,一开始就是云原生的状态,在将开源的快速迭代能力和云的敏捷性相结合后,使得 TiDB 这样一个开源数据库只用了 7 年时间,就成为中国最流行的数据库,在墨天轮国产数据库排行榜上一直保持第一名位置。在 Gartner 2022 云数据库“客户之声”中,PingCAP 成为中国唯一入选的分布式云数据库服务商。沙利文头豹研究院也将 TiDB 放在《2021 年中国分布式数据库市场报告》领导者象限。

中国基础软件全球化创新之路——自主开源模式

在 TiDB 的成长历程中,最重要的一个关键词就是“自主开源”的发展模式,该模式经过 7 年多的实践,得到了客户、分析机构的认可,也获得政府机构极大的肯定。现在业界和金融行业里都有了一个新的认知:唯有真正自主开源才能从根本上解决卡脖子问题,并持续保持领先性。这种发展路径不是简单地去替代他人的过去,而是使我们的技术始终保持在世界前列,构建一个“开源和多云”的新生态。今天选择 TiDB 不只是解决今天的问题,10 年以后它在全球也将是最先进的数据库。

众所周知,数据库市场有很多流派,很多品牌的数据是一个品牌的名字,在一个品牌下面又有很多的技术栈,对于大多数客户而言,数据库用起来通常都很复杂,往往一个项目涉及N多产品的集成,那么能不能有一个简单而强大的数据库呢? TiDB 只有一个产品,它可以在公有云上、私有云上,行业云上、客户的数据中心里部署。只要懂 SQL ,用户就能以一种统一的体验解决自己业务和应用的问题。

TiDB 的很多大型客户已经以 1+N 的方式在部署 TiDB,他们在数据库核心系统用 TiDB 企业级版本,在云上部署一个 TiDB 的云数据库。用户可以自动扩容解决海量数据规模,TiDB 最大的用户已经有近千台节点。所以,无论是对数字原生企业,还是数字转型企业,比如保险行业,在做数字化转型时,都会让用户没有任何负担地去使用数据库,同时简单而强大,不用关心它的部署模式。

借助开源模式最大的好处就是能够最快速度获取用户,有一些比 TiDB 成立还早的公司到现在也只有 100到200 个客户,而 TiDB 在全球已经拥有超过 3000 多家用户,不乏一些顶级的技术巨头,包括美国、日本、东南亚的客户,中国的银行和保险行业客户。作为一个第三代开源和云原生的数据库,TiDB 可以天然服务于数字化企业,现在还在把这种能力传递给更多经典传统行业进行数字化转型。

数字化创新三层结构

如上图所示,产业界发展到了这个时候,出现了明显分层。最底层做云基础设施的,不管是公有云、私有云,还是混合云,IaaS 层已经足够大,足够稳定。最上层的是的类似中科软这样的大型应用软件供应商,主要做端上的创新,如私域运营、会员等。而未来世界最重要的中坚力量将来自于数据价值的创新,新一代数据库会逐渐结合大数据技术和人工智能技术,形成相对独立的中间层。这一层既是开源又是多云的,向上对业务的场景支撑会更直接,向下对于云资源的运用会更加智能。对于所有面向客户经营的业务和面向业务人员的客户,他们希望有一个一栈式的技术栈,既解决实时交易,又能分析业务,这相当于是一个数据的“任意门”,这边做保险的核心交易,同时在另一边又能看到数据大屏和评估可能的业务风险。

TiDB 的定位便是如此,以一个统一的数据服务层,同时面对海量交易和实时分析,能够满足巨大的吞吐量和各种各样的数据分析要求。作为一个原生的分布式数据库,TiDB 可以从 1TB 扩展到 1PB,从单机版数据库覆盖的范围,一直拓展到大数据覆盖的范围。同时,开放的 TiDB 还可以和其他大多数数据湖、数据仓架构相融合。

TiDB 分布式数据库在财险的应用

A 财险巨头的单证系统面临着数据量增长迅速、业务并发量高、处理性能低等挑战,传统 IOE 架构下需要依赖昂贵的高端服务器,软硬件及服务成本非常高,业务方希望能有一个 HTAP 数据库,既满足单个订单的快速处理,又满足批量订单的分析处理,实现降本增效的目标。传统的数据库产品面临着许多技术难题,海量数据下系统能不能自动伸缩扩展?有没有单点故障?TP 响应时间长,AP 分析报表时间达小时级,这些问题解法只有通过新一代的原生分布式数据库才能解决。

TiDB 基于原生分布式架构,计算存储分离设计,可在线弹性扩缩容。HTAP 一栈式架构支持混合负载,支持高并发实时交易业务和复杂分析查询,可实现毫秒级的 TP 与秒级的 AP 查询能力,并且具有良好的物理隔离性与数据强一致性。TiDB 还高度兼容 MySQL 生态,从用户视角看上去就是在用一个大号的 MySQL,但是容量高了 1-2 个数量级,价格却低了 1-2 个数量级。同时,TiDB 在国产化适配方面与主流国产服务器及操作系统兼容适配, 与 170 多家合作伙伴形成上下游的整体生态。

在该财险案例中,通过从 Oracle 迁移到 TiDB ,在单证的交易系统中,平均时长从分钟级提升到秒级,效率提升达到几十倍,在分析方面甚至有上百倍的性能提升,这就是新一代分布式数据库架构优势带来的价值。同时,原生分布式数据库带来的天然的弹性扩展和高可用可以保障保险业务的高速增长。

与 A 财险不同,B 保险集团是先从互联网业务开始接触 TiDB 的,彼时传统单机版数据库和云数据库都支撑不住其互联网业务 APP 的快速发展。于是,TiDB 从外围到核心,切入到多个互联网业务系统,陆续支持客户信息管理系统,帮助 B 保险集团的硬件成本节省超过 30% 以上。在第二阶段,TiDB 继续挺近客户统一营销活动管理、客户信息核心管理、保单服务、理赔等多个业务系统中,助力坐席电话销售中心的实时大屏等创新场景,帮助客户系统实现边交易、边分析,提升业务系统的数据实时分析能力。第三阶段,客户通过 TiDB 实现自主创新,实现产险、财险、普惠金融等多个业务单元的核心系统替换。未来, B 保险集团还希望通过 TiDB 实现更多的数据自主和对于多云架构的兼容。

在此过程中,B 保险集团还基于 TiDB 的版本开发出自己的数据库版本。开源带来的好处是所有的代码都是全透明的,不需要依赖于上游的变化,可以打造自己的特定保险行业的自主创新体系,并不断演进。

保险数字化:进入融合发展时代

保险行业已经经历了物理网点时代、渠道时代、互联网时代,目前形成了以移动互联网为代表的端侧客户运营和会员体系。再下一代可能是什么?保险将无处不在。未来的场景和产业只要有“焦虑”,就会有保险的机会,都需要将保险融到其中,所以这将是一个“融合时代”。

目前,保险行业解决了人的安全需求,如人身焦虑、财产担心、常见的车损等等。在未来的元宇宙、web 3.0 等虚拟世界中,如何保障虚拟财产的损失,区块链会不会给保险行业带来数据所有权的根本性变化?这将带给保险人更多的想象空间,未来保险行业肯定也会产生新的形态,既要尊重人的社会需求,又要考虑新技术带来的更多可能性。