集中式与分布式一体化架构,达梦给企业更好的选择

今年6月,达梦数据成功在科创板上市,成为国产数据库第一股。达梦数据库经过几十年的发展,始终坚持自主研发,原始创新,依托达梦一套代码根,不断满足各行各业客户对数据库的需求,走出了一条中国数据库自主发展之路。

数据库选择集中式还是分布式是一个长盛不衰的话题,一些客户可能也会纠结该怎么选。在第15届中国数据库技术大会(DTCC2024)上,达梦数据产品服务中心总经理黄海明带来《达梦集中式与分布式一体化新型集群架构的创新与应用实践》的主题演讲,分享达梦数据的思考和创新实践,达梦数据库集中式与分布式一体化架构,给企业更好的选择。

▲达梦数据产品服务中心总经理 黄海明

达梦在关系型数据库两种主要架构的创新突破

黄海明认为,现在关系型数据库重点有两种,一种是集中式的共享存储集群架构,一种是分布式架构,分别有各自的适用场景。现在两种架构被炒作成了路线之争,这是非理性的,希望大家能够放下路线之争,回归理性,回归需求,选择合适的数据库产品。

作为全栈数据产品和解决方案提供商,达梦依托一套代码根(Code Base),在共享集群架构和分布式架构方面不断创新突破。

在达梦数据共享集群(DM DSC)方面,通过在数据库内核层面重构迭代,依托自研的共享文件系统DMASM,已支持ASM镜像和条带化及数据亲和性的负载均衡功能。现在DM8共享存储集群突破了8节点,结合达梦主备技术,具备金融级同城双中心和两地三中心的高可用解决方案,异地容灾对标MAA,故障切换时间最快可以做到5秒以内。

目前,达梦数据共享集群在党政、金融、轨道交通、能源等关键行业的核心系统得到深入应用,比如应用在国网调控云、某大型央企超大型ERP系统、梅州客商银行核心系统、某千万级人口大城市地铁互联网检售票系统等领域,具备大规模商用能力。

其中,某千万级人口大城市地铁互联网检售票系统要求生产中心和灾备中心对等建设,其ACC系统(清分中心)和iAFC系统(互联网自动售检票系统)各自采用达梦数据共享集群4节点+4节点形成同城双中心,完成了对Oracle高端一体机的平滑替代。

在分布式数据库(DM DPC)方面,达梦也早有布局,从MPP架构起步,逐步发展为存算分离的原生分布式架构,可有效支持HTAP混合负载,具备多副本高可靠,基于RAFT协议保证强一致,可以灵活扩缩容。其最大的特点是继承了达梦单机库强大的SQL能力、兼容性和成熟的优化器。优化器是数据库的核心,达梦可以把SQL优化能力从集中式数据库很平滑地迁移到分布式数据库产品里,为客户提供成熟稳定、移植和学习成本低的分布式数据库解决方案。

黄海明重点分享了达梦分布式数据库在福建移动大数据、某新一线城市全民医疗健康系统的应用,福建移动大数据成功替换了TeraData Aster和GreenPlum。某新一线城市全民医疗健康系统是今年上线的HTAP混合负载业务,其业务涉及面大,其中便民服务系统面向覆盖2500多万人口,系统数据库查询并发量高峰时期超过5000,日常大约2000,对数据库提出了很高的要求,需要高并发、高可靠,且要求主要服务响应时间3秒内,需要数据库具备海量数据复杂统计分析能力,达梦分布式数据库提供了很好的支持。

集中式数据库和分布式数据库在架构上存在差异,在部署和运维方面也存在很大差异,给用户选型增加了困难,达梦数据库集中式分布式一体化架构让大家不必纠结,给用户更好的选择。

一套“代码根”长出的一体化新型集群架构

达梦数据认为,集中式和分布式一体化融合架构才是数据库发展趋势,达梦数据库是统一内核,依托同一套代码根,可以根据用户的需求灵活部署成集中式或分布式。

黄海明介绍,达梦的一体化体现在以下两个方面:

一方面,依托一套内核代码根DM8,达梦数据实现了集中式和分布式的一体化架构。可以根据业务需求灵活部署成集中式或分布式,提供统一的语法、编程接口及运维管理,为用户提供统一良好的体验,不用再纠结到底该选分布式还是集中式。

另一方面,进一步在底层融合分布与集中式。集中式和分布式并不是两个技术路线,两种架构都是在关系型数据库的范畴,达梦数据库在一套代码根中生长出来的集中式和分布式是一脉相承的,很多技术都可以复用。比如,Raft共识算法不仅用在分布式架构上,也基于Raft协议实现了主备集群。还有集中式数据分区与分布式数据分片融合。集中式和分布式优化器共用,可以处理非常复杂的SQL。高度代码复用,也能有更好的质量控制保障。

“达梦最大底气在于所有的代码都是我们自己写的,我们能最大程度上复用代码,减少干扰。”黄海明说。

达梦数据库集中分布式一体化架构有不少独特之处,比如可以实现存算一体和存算分离自适应,以满足不同业务场景需求。密集交易型的业务,需要低延迟,精确命中业务负载,可以把计算节点和存储节点融合,业务直接连接存储节点减少了一层网络交互,可以有效提高性能和吞吐量。对于CPU密集型分析型应用,可以采用计算节点和存储节点分离的模式,提高业务处理效率。对于高可用容灾要求比较高的业务负载也推荐采用计算和存储分离模式,提高可靠性。

黄海明认为,与竞品相比,达梦数据库的一体化架构差异体现在对特定业务需求的适配性、技术实现的细节以及性能优化的策略等方面。其优势在于更高的性能表现、更强的稳定性、更便捷的运维管理,以及对国产软硬件环境的良好支持等。

达梦数据库集中分布式一体化架构通过数据库内核底层对集中式、分布式的最大程度融合,提供平滑过渡能力、统一的开发和运维体验,尽可能屏蔽掉架构的差异和复杂性,让客户可以根据业务场景灵活选择合适的部署方式。目前,其一体化架构也获得了越来越多客户的认可。某运营商O域+B域相关系统就采用该方式部署,除容器云管理平台采用单实例部署以外,大数据分析系统、数据集市系统均采用达梦分布式集群部署,移动办公系统、动力网管系统采用集中式共享存储集群部署。这种灵活的部署方式让用户可以更自由选择,最高记录1个月内就陆续上线了8套系统。

小结:自主可控的“代码根”是创新的本钱

国产数据库的未来在于创新,创新需要不断“折腾”,其中难免要经历试错。从集中式架构共享存储集群的突破,到原生分布式架构,再到集中式分布式一体化,达梦数据能够根据市场需求不断创新突破,关键在于有一套自主可控的“代码根”,正如黄海明所说:“万丈高楼平地起,打好地基是前提,要持续不断地创新,一个可控的‘代码根’才是‘折腾’的本钱。”