国产分布式数据库选型及满意度调查(2021)报告发布

数据库选型一直是业界最热议的话题之一。

随着摩尔定律的失效,以前靠升级硬件实现Scale Up的方式已经不行了。让数据库Scale Out变成新的考虑目标。当数据量达到一定量级时,采用分布式数据库往往是必经之路。

因此,分布式数据库近年来广受关注,许多厂商都推出了相应的分布式数据库产品,并且价格从免费到数百万不等,选择多了,选型难度就更大了。

另外,到目前为止,分布式数据库的选型还没有一个真正科学并广泛接受的标准,可以准确评判某个分布式数据库的好坏。因此,分布式数据库选型是一个十分具有挑战并且需要小心的工作。

本调查定位面向金融行业国产分布式数据库选型及满意度调查?有2个方面的原因。

其一、分布式,为国产数据库打开了一个全新的思路,“沿着同样的路线再造一个Oracle根本不可能,也没有意义”成为国内数据库从业者的共识,分布式数据库被认为是“变道超车”的机会。在这条赛道,中国没有落后于人,因为中国人口红利,有着世界绝无仅有的场景支撑。比如:蚂蚁集团自己研发的数据库OceanBase已经能够支撑住双11的压力,并且性能还不错。美国商务部“拉黑”12家中国企业,再次激发国产替代的预期。

其二、金融行业下一步分布式改造已然成为必然趋势,2019年中国人民银行印发《金融科技(FinTech)发展规划(2019-2021 年)》(银发〔2019〕209 号)金融科技发展三年规划中提到的“加强分布式数据库研发应用”的要求,目前已经接近收关。

因此,用不用分布式数据库已经不是问题,而是怎么选?怎样用?如何用好才是迫切需要解决的问题。

那么,在如此众多的产品中,金融行业企业到底应该如何正确的选择国产分布式数据库供应商,如何选择最适合企业自身的国产分布式数据库服务,从而让企业真正实现效率的提升,满足业务发展的需求,同时节省成本开支。

目前,已经应用国产分布式数据库的企业满意度如何?他们是如何应用国产分布式数据库的?踩过哪些坑?如何规避?国产分布式数据库在使用过程中,有哪些突出的问题?对于其他即将应用国产分布式数据库或者使用效果不明显的企业,有哪些值得借鉴的,国产分布式数据库供应商还有哪些可以改善的地方?这是我们本期报告所关注的点。

数据说明:2021年5-12月,IT168面向旗下ITPUB、ChinaUnix社区进行调查,调查对象涵盖CIO/CTO(3%)、技术总经理/总监(8%)、DBA(21%)、架构师(14%)、技术经理(21%)、项目经理(12%)、研发工程师(14%)等,回收问卷1391,其中银行、保险、证券等金融行业合格问卷476。

为了更加有效地保障金融行业调查数据的有效性,除了问卷调查,我们针对金融企业,又定向地展开了超过200次的电话微信调查,并采访了近30位金融企业的数据库领域的技术专家,得出了当前的国内《国产分布式数据库选型及满意度调查报告》。特别说明:本次调查,以部署的企业的案例数为主,不看具体的部署节点数。

报告主要结论:

分布式数据库应用在金融行业是大势所趋

金融行业分布式数据库改造更青睐原生分布式架构技术路线

产品选择和使用上,OceanBase最受欢迎

产品技术及服务能力上,腾讯云TDSQL最受推崇

安全性(可用性、可靠性、稳定性)是金融行业选择分布式数据库的首要指标。

目前,分布式数据库在金融行业的应用场景分析偏多,交易次之。

部署方式私有云与混合云部署将是常态

运维复杂度提升是金融行业在应用分布式数据库过程中遇到的最突出问题。

国产分布式数据库用户满意度:OceanBase第一

国产分布式数据库供应商推荐度:PingCAP第一

运维复杂让金融行业对供应商提供相关数据库优化软件有较强诉求

分布式数据库应用在金融行业是大势所趋

在调研中,我们首先对金融行业的分布式数据库应用情况做了调查,从下图中,我们可以看到,81%的受访人表示,其所在企业已经、正在或计划部署分布式数据库,其中已经部署、正在部署、正在计划部署的企业分别占比37%、18%、26%,只有19%的企业表示没有任何计划。这说明,分布式数据库在金融行业中的应用是大势所趋。

调查发现,分布式数据库在金融行业中的应用之所以是大势所趋,有两个大背景,其一,业务驱动,随着数据井喷,金融行业不仅业务需求升级倒逼架构创新,同时互联网金融的快速发展对金融系统能力带来全新挑战,传统集中式数据库已经难以承载,而分布式能很好的解决这一问题。其二、政策指引,《金融科技(FinTech)发展规划(2019-2021)》中明确指出:“加强分布式数据库的研发应用。做好分布式数据库金融应用的长期规划,加大研发与应用投入力度。有计划、分步骤稳妥推动分布式数据产品先行先试,形成可借鉴、能推广的典型案例和解决方案,为分布式数据库在金融领域的全面应用探明路径。

分布式数据库改造更青睐原生分布式架构技术路线

分布式数据库选型首先面对的是技术路线的选择,原生分布式架构,重构了数据库系统,原生支持分布式事务处理与数据切分,在扩展性方面存在天然的优势,在未来具有更广阔的发展空间,但目前产品成熟度,仍需时间锤炼。

分库分表中间件技术相对成熟,但对数据库的核心能力改造并不多,基本上都沿用了原来单点数据库的核心能力,最大的优势是能够以最小的代价在最短的时间内突破单点数据库的瓶颈。

企业选择了一个分布式数据库产品之后,意味着选择了未来五年甚至十年的一个技术路线,因此,大多数用户从长远角度来看,更愿意选择原生分布式架构。

调查也证实了这样的结果,56%的受访者更倾向于原生分布式技术路线。而倾向于分布式中间件+分库分表的受访者也不少,占比44%。(说明:数据仅代表受访者选择的倾向性,并不代表当下的应用状态)

产品选择和使用上,OceanBase最受欢迎

金融企业对分布式数据库产品的选择和使用,毫无疑问是各大厂商争夺的焦点,对于其他企业也极具参考价值,下图是一个多选项的调查数据。

特别说明:该项调查,以部署的企业案例数为主,不看具体的部署节点数。对GaussDB的定义并不包含openGauss。

有16.67%的受访者表示,其所在企业已使用或计划采用OceanBase,排名第一。2012年OceanBase开始支持支付宝,2014年替换支付宝交易系统,2015年双十一100%支持交易数据链和支付数据链,2016年双十一支付宝的整个核心账务库已经运行在OceanBase上,2017年蚂蚁集团的所有核心数据链全部迁移到OceanBase。今年OceanBase宣布开源,并一次性开放300万行代码,都让OceanBase备受关注。调查显示,OceanBase具有丰富的金融级内部实践与商用实践,商用案例覆盖国有大行、城商行、农商行、证券及保险行业,其中不乏重度使用案例,目前金融领域TOP200的客户服务比例高达四分之一。

第二名华为云GaussDB占比15.32%,与第三名腾讯云TDSQL15.21%,差距极微。短期华为云GaussDB受华为整体战略调整影响,但从长期看,是看好的。而腾讯云TDSQL过去一年在金融行业大力发展,遍地开花势头很猛,在TOP 10 银行中服务比例高达 60%,劲头十足。

产品技术及服务能力上,腾讯云TDSQL最受推崇

数据库供应商的产品技术及服务能力,也是金融行业选择分布式数据库至关重要的环节。数据显示,在当前各个分布式数据库产品的供应商中,腾讯云 TDSQL的产品周边生态完善程度及服务保障能力,最受金融企业用户推崇,占比23.4%,目前TDSQL已助力20余家金融机构完成核心替换。

腾讯云TDSQL在产品实施的技术服务方面,建设了完善的产品实施服务、维保服务团队,有实力保障金融用户的数据库产品的实施与日常运营。

另外腾讯云TDSQL提供了比较完整的产品周边服务工具套件。金融企业选择使用分布式数据库产品时,实现高质量与高效的数据迁移,是一项至关重要的任务。

安全性(可用性、可靠性、稳定性)是金融行业选择分布式数据库的首要指标

金融是国民经济的命脉,数据是金融企业最核心的资产,所以,金融行业对分布式数据库的要求“稳”是第一位的,数据既不能错也不能丢,同时系统不能停,因为,一旦系统停机会给金融企业带来无法估量的经济和名誉损失。因此,金融企业对与“稳” 相关的“可用性、可靠性、稳定性”的要求较为极致。

安全性自然成为分布式数据库选型的首要指标,占比20%。其次是产品服务能力与价格,占比18%,容灾能力占比13%,技术产品领先性,占比10%,可扩展性占比9%。

当前分布式数据库在金融行业的应用场景分析偏多,交易次之

数据和分析是数字化转型的关键,金融科技以技术创新推动业务创新带来了更多大数据分析需求,而信创则加速了国产化替代进程,尤其是一些金融企业核心业务分布式改造进程标志着金融级分布式数据库逐渐走向成熟和稳定。

调查显示,有36%的分布式数据库被用于大数据分析,30%用于传统业务,14%用于互联网业务,12%用于人工智能场景,其它场景8%。

私有云与混合云部署将是常态

在金融行业,数据库部署模式不仅与监管要求有关,也与企业规模相关,尤其是头部企业。目前在金融行业,尤其是核心系统,处于对数据主权及安全考量,大多数还是独立部署,但随着基础层及平台层的快速云化,上云是必然趋势。

调查显示,从云部署模式看,私有云与混合云部署将是常态,其中私有云部署占比46%,混合云部署占比37%,公有云部署只有17%。

运维复杂度提升是金融行业在应用分布式数据库过程中遇到的最突出问题

相比传统商业数据库,分布式数据库会有更多的节点和组件,更难于管理。

调查显示,金融行业在使用分布式数据库过程中,最突出的问题是运维复杂度提升,占比18%,其次是人才储备不足,占比16%,对原有应用系统升级改造成本较高,占比15%,数据迁移难度大占比14%,兼容性问题,占比11%。

运维复杂让金融行业对供应商提供相关数据库优化软件有较强诉求

相比传统商业数据库,分布式数据库相对较新,金融企业在分布式数据库方面的自有运维支持能力有待进一步提高。所以,为了降低运维复杂度,金融企业对供应商提供相关图形化的数据库优化软件或工具有较强的诉求。

用户满意度:OceanBase第一

具体到供应商满意度,OceanBase以7.65分满意度排名第一, PingCAP以7.55分排名第二,华为云GaussDB以7.27排名第三。

通过对选用(或者试用)OceanBase的用户进一步调查得知,OceanBase相比其它开源数据库,具备技术领先性的优势,技术领先性主要在于功能和性能,双十一和TPC-C打榜是最有力的证明,并且支持MySQL和Oracle、Paxos协议、生态工具等。

安全性,OceanBase满足行业规范,如支持私有化部署,支持多中心多副本架构满足容灾高可用需求。

服务方面,OceanBase有较为完善的产品服务体系,尤其在某些方面表现突出,多位受访者表示其解决问题时效比较快。

供应商推荐度:PingCAP第一

在供应商推荐度方面,PingCAP以7.86分排名榜首,腾讯云TDSQL以7.12分排名第二,OceanBase以7分排名第三。

通过对选用(或者试用)TiDB的金融行业用户的进一步调查得知,TiDB原生分布式架构适用于海量数据规模的OLTP和混合负载业务,对MySQL高度兼容,相较于分库分表方案,对业务无侵入,在线 DDL 对敏态业务开发友好。TiDB 5.0 版本引入MPP模式,支持函数和算子下推, HTAP引擎可以提供更加强劲的算力,目前已在银行、证券等金融机构的实时数仓、风控、营销和数据中台等场景中得到落地应用。

不过,对于金融用户而言,之所以更愿意推荐TiDB,就是 TiDB 是一个开源的项目,而且社区很活跃,版本迭代快速。一方面,对于企业用户而言,企业的技术团队可以方便地深入到数据库核心代码的开发中,有利于对数据库平台的后期深度的运营开发维护。另一方面,一旦有疑难问题时,可以向社区求助,通过社区平台解决问题,从而降低可能产生的服务支持费用。

数据来源:ITPUB & IT168

调研时间:2021年5月-12月

发布时间:2021.12,出品:ITPUB