华为 GaussDB 数据库十问

自2019年5月15日正式发布以来,华为GaussDB数据库受到业界的广泛关注。针对客户和读者的反馈,我们整理了关于GaussDB数据库的十个热点问题,让您能够快速一览华为GaussDB数据的“庐山真面”。

1、GaussDB的命名有什么含义?

GaussDB是华为数据库产品品牌名,意在致敬数学家高斯(Gauss)。GaussDB系列数据库产品包括GaussDB OLTP数据库和GaussDB OLAP数据库,广泛应用于金融、政府、电信等行业,并已经进入核心系统,满足客户对智能时代高并发事务实时处理、海量数据高效分析的需求。

2、GaussDB系列数据库是自主研发的吗?

GaussDB OLTP数据库是华为公司自主研发的分布式数据库,基于华为公司在2007年开始研发并在电信计费领域规模商用的自研内存数据库全面改造,支持x86和华为Kunpeng硬件架构,基于创新性数据库内核,提供高并发事务实时处理能力、两地三中心金融级高可用能力和分布式高扩展能力,用于支撑金融、政府、电信等行业核心关键系统。当前支持单机、主备、分布式等主流部署方式。

GaussDB OLAP数据库是一款具备分析及混合负载能力的分布式数据库,从2011年开始,基于PostgreSQL 9.2.4的基础上自主研发,支持x86和华为Kunpeng硬件架构,支持行存储与列存储,提供PB(Petabyte)级数据分析能力、多模分析能力和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景,广泛应用于金融、政府、电信等行业核心系统。

3、GaussDB OLTP数据库的发展历程是怎样的?

GaussDB OLTP数据库有着12年研发历程。2007年,在电信实时计费项目领域,华为开始组织人手研发内存数据库。2010年,华为数据库研发团队开始对2007年版本进行全面重构,并写下了重构版本的第一行代码,数据库对象的定义:“typedef struct st_database{…}database_t;”

从这个版本开始,华为数据库的定位已经不再仅局限于内存数据库,而是在向通用关系型数据库逐渐转变,重构过程中,开始融入大量非内存数据库的特性,这就是Gauss OLTP数据库的前身。GaussDB OLTP数据库基于华为强大的研发平台,有着整套完整的标准流程和研发支撑体系,历经10多年的积累,已经陆续在电信和金融行业核心系统成功上线,其高性能和稳定性都得到了金融和电信客户的认可。

4、GaussDB OLTP数据库有哪些特点?

GaussDB OLTP数据库是一款全自研的分布式数据库,主要面向OLTP场景,产品特点包括:

● 高可用:故障倒换时间<10s,支持闪回

● 高性能:基于鲲鹏920处理器,性能超越业界其他TOP商业数据库30%

● 高扩展:分布式强一致,TPC-C扩展比>0.8

● 兼容性:支持SQL-92、SQL:1999、SQL:2003等一系列标准的常用语法,兼容业界其他TOP商业数据库常用的SQL语法,支持离线/在线迁移

近日,经中金国盛认证中心检测,根据金融行业标准《分布式数据库技术金融应用规范(草案稿)》、中金国盛企业标准《分布式数据库技术金融应用检测规范(试行)》,基于华为鲲鹏处理器和通用CPU的华为GaussDB数据库,均通过本次检测,82个检测项全部为“符合”。测试主要覆盖了环境搭建、环境监测、语法支持、安全支持、扩展、性能、容灾等金融级数据库要求的关键能力项。

5、GaussDB OLTP数据库目前市场使用情况如何?

GaussDB OLTP数据库目前在电信、金融、大企业、政府等多个行业实现商用。例如,GaussDB OLTP数据库在电信行业核心系统成功上线;GaussDB OLTP数据库在基于华为Kunpeng硬件架构的16节点的TPC-C标准测试中,性能达到千万级tpmC。

2017年,华为与招商银行首次成立了“分布式数据库”联合创新实验室,并在过去2年中取得了丰硕的合作成果。金融级可靠性在联创过程中得到商用验证:在关键的故障恢复指标上,华为GaussDB性能领先,AZ内RTO<10s,满足金融场景下数据库高可用诉求,且目前该系统稳定运行超过500天。

目前,华为GaussDB系列数据库产品全球累计发货超过30000套。

6、GaussDB OLAP数据库的发展历程是怎样的?

GaussDB OLAP数据库于2011年开始预研,之后基于PostgreSQL 9.2.4进行全面改造,历经8年持续不断研发投入,已经形成了自身的完整内核。GaussDB OLAP已经演进成大规模并行处理的分布式数据库,支持行列混合存储以及线程化,能够支持高达2048节点的集群规模(已经通过信通院的512节点认证)。数据库内核三大引擎中,优化器(含SQL解析和SQL优化)、执行引擎、存储引擎,除了SQL解析部分,其他都已重构。

GaussDB OLAP通过全新构筑分布式执行,MPP通信框架,向量化引擎,编译执行引擎从多维度重构了执行引擎,通过列存及自适应压缩、分布式事务等,全新重构了存储引擎。由于SQL解析器、JDBC、ODBC等是数据库生态的重要组成部分,也是GaussDB OLAP构筑生态策略的一部分,因此在这方面做了大量增强。

除了数据库内核有了翻天覆地的变化之外,在集群管理、高可用和数据库安全方面,GaussDB OLAP数据库也做了极大的增强,同时申请了多项专利。作为企业级分布式数据库产品,GaussDB OLAP数据库还提供了包括运维管理、开发工具、迁移工具、数据复制工具等五大完整工具集。

2014年,华为孵化出Gauss OLAP数据库第一个产品版本(早期也叫做FusionInsight MPPDB或FusionInsight LibrA)。2015年,华为与工商银行一起联合创新,孵化出了包括TCP多流,逻辑集群等多项创新技术。双方从联合创新进入实践和应用,最终在2019年,顺利完成了核心数仓系统GaussDB OLAP数据库对国际顶尖数据库产品的替换和演进。

7、GaussDB OLAP数据库有哪些特点?

GaussDB OLAP数据库主要面向OLAP场景,支持MPP(大规模并行处理)分布式部署方式。产品特点包括:

● 高可用:故障时查询自动重试,同城/异地双集群容灾

● 高性能:核心企业数据仓库场景下,分析性能持平其他业界主流分析型数据库,基于Kunpeng 920处理器芯片,相对通用同期芯片,TPC-H/TPC-DS性能提升30%,支持GPU异构多维硬件加速(10万路摄像头千亿图像比对秒级响应)

● 高扩展:单集群最大支持2048节点,在线扩容,重分布对业务透明

● 数据融合:SQL on Anywhere,支持与异构/同构数据源、FusionInsight大数据库互联互通

● 计算融合:支持x86/华为Kunpeng CPU、GPU等异构计算芯片的智能调度,实现算力最优

● 数据安全:数据透明加密,支持国密算法SM4,行级细粒度权限控制

8、GaussDB OLAP数据库目前市场使用情况如何?

截止2019年5月,华为GaussDB数据库和FusionInsight大数据平台已经应用于全球60个国家及地区,服务于1500多个客户,拥有500多家商业合作伙伴,并广泛应用于金融、运营商、政府、能源、医疗、制造、交通等多个行业。

近日,在中国信息通信研究院和数据中心联盟发起的分布式分析型数据库测试中,华为GaussDB OLAP数据库率先通过512节点集群规模能力评测。与此同时,中国工商银行也完成了采用华为GaussDB OLAP数据库对国外顶级数据仓库产品的完全替代。

目前,华为GaussDB系列数据库产品全球累计发货超过30000套。

9、GaussDB有数据库一体机形态的产品么?

华为GaussDB数据库也将推出基于华为Kunpeng硬件架构的数据库一体机,分为GaussDB OLTP和GaussDB OLAP两大系列。一体机形态包含GaussDB数据库软件形态的所有特性,还拥有软硬深度整合带来的预集成、预调优、高性能、高安全、高可靠等独特优势,丰富了金融、政府、电信、大企业等行业客户数据库系统建设的选择。

10、如果想学习GaussDB系列数据库产品,有什么渠道?

有多种渠道可以学习华为GaussDB的系列数据库产品:

● 关注“华为IT产品解决方案”公众号,及时了解GaussDB数据库产品相关动态

● 访问华为官网获取产品资料

● GaussDB开发者社区提供开发工具、互动社区、开发指南、安全中心等服务

● GaussDB培训认证:关注“华为认证”公众号,获取HCIA & HCIP以及HCIE等GaussDB数据库认证培训最新信息

● GaussDB金种子计划:目前,华为已与清华大学大数据系统软件国家工程实验室、华东师范大学、武汉大学、重庆邮电大学成立GaussDB数据库创新实验室,共同开展数据库学术研究。此外,面向高校学生,华为发布的金种子计划也会陆续在全国多个高校构建基于GaussDB的数据库原理课和实训课。