“半亩方塘一鉴开,天光云影共徘徊。问渠那得清如许?为有源头活水来。”
宋代朱熹的《观书有感·其一》
如果说朱熹以方塘作为比喻,表达了微妙难言的读书感受。作为数字经济时代的根基,数据库技术创新意义重大,如若把数字经济也比喻为方塘池水,为了让其天光云影共徘徊,在中美竞争大背景下,则数据库技术是必须攻克的难题,是源头的活水。
中国数据库技术发展并非一穷二白,从国产数据库、开源到互联网云原生数据库,国内拥有良好的技术基础和成绩;但也应该看到,与国外成熟商用数据库相比,国产数据库在市场规模、产品技术良性发展速度上,还有一定的欠缺和差距。
如何缩短这个差距,除依赖业内同仁不懈努力之外,创新商业和管理模式也是必然的选择,正是在这样大背景下,openGauss数据库开源社区应运运而出。
并非简单开放源代码
为什么答案落在开源社区上?
所谓开源就是开放源代码,意味着可以免费使用,这是多数人对于开源软件的理解。
但是实际上,开源软件早已不是代码开放这样简单,而是软件开发的协同方式,技术创新有效途径。
开放源代码,只是开源软件的初级阶段,第一步。尤如 有生命中,要成长开源软件不是一劳永逸的,也有一个发展和演进的过程。人工智能、大数据、云计算、容器、微服务化等技术的演进,GPU、DPU、SCM、SSD、Optane等新硬件技术发展,语音、视频监控等流式数据处理的新需求,这些因素的融入,为开源产品能够不迭代和创新提供了无穷的契机。
仅仅依赖个体开发者的贡献显然难以持续,开放源代码就像一粒种子。种子的成长离不开水和阳光,开源的成长也是如此,必须有生态力量的介入。如今一些大型软件,如操作系统、数据库、Office等,其复杂度和工作量早已不是几个人可以掌控,需要依靠团队协作,成千上万人的齐心合作。
通过开源社区这种方式,全球各个等级人力资源得已凝聚,这也被越来越成为软件产业界各方的共识,这也是微软、VMware、谷歌、Facebook等软件企业积极拥抱开源原因。
在全球无数组织、机构、用户、企业和个人的加持下,开源已经蜕变,实现了从开源代码到大型软件有效开发的华丽转身。
openGauss从珠姆朗北峰攀爬,构筑核心竞争力
openGauss在开源之前已在电信和企业市场有超过10年的应用的历史,肩负着通信网络和企业核心业务中关键数据管理和服务重任。经过市场大量的检验和打磨,日益成熟。
openGauss从开源上线起,一直瞄准企业的核心业务数据库场景。一是因为openGauss之前在核心业务中大量成熟应用,具备这样的基础;二是因为就攀爬珠峰北坡,虽然很难,但是锻造自已真正竞争力的有效方式。
“独行快,众行远”,openGauss要想在数据库行业中真正立住,光有决心是不够的,需要和产业界的伙伴齐心合力创新,广泛使用,悉心打磨,才能成功。这就需要建立生机勃勃的openGauss生态。
openGuss以开源社区为平台,联接“政,产,学,研,用”力量,共同发展生态。截至目前为止,吸引了2500多名个人开发者,100多家企业开发者加入社区在持续贡献开源。已经完成4次大版本迭代,社区版累计下载51万次,覆盖81个国家,并正在向轻量化、集群管理、兼容能力和分布式数据库方向演进。
openGauss在开源生态持续发力,在12月28日,北京线上线下同步举办了openGauss Summit 2021活动,大会以“汇聚数据库创新力量、逐梦数字时代星辰大海”为主题的向业界汇聚人心,传递给人:openGauss肩负着“数字时代星辰大海”的使命,需要“凝聚并联合产业创新的力量”。也因为如此,openGauss开源社区对理事会、技术委员会进行升级,并组建openGauss社区分委会,制定了新的人才培育计划。
经过openGauss理事会決议,在2021年9月,中国移动、中国电信、中国联通、招商银行、邮储银行、清华大学等首批18家理事会单位的基础上,增加中国海油、超聚变数字技术两家成员。来自华为、海量数据、云和恩墨、神舟通用、北京超图、民生银行、招商银行等7个公司的16名数据库技术专家共同组建了新的技术委员会,与社区全体成员一起,在内核、安全、AI、云原生等领域开展技术创新,持续构建openGauss开源数据库的技术竞争力。
openGauss社区分委会负责搭建面向高校师生的平台,推动产研融合、产教融合,加速培养数据库产业人才,openGauss社区分委会由openGauss社区主导,由鲲鹏&欧拉生态创新中心负责运营,与数据库产业链伙伴共建。
目前openGauss版本规划按照6个月一个小版本,1年一个大版本的节奏,版本生命周期暂定3年,产品形式有社区版、合作伙伴商业版、用户自用版和华为云GaussDB(for openGauss)云服务。针对不同需求,实现线上线下全业务应用场景支持与覆盖。
百花齐放的数据库技术
如今数据库的发展,早已经超越了传统关系型数据库。互联网应用飞速发展所带来的海量数据访问需求,传统关系型数据库也通过分库、分表来化解危机,并增加了对文件、音频、视频等非结构化数据的支持,希望一个数据库能够同时满足OLTP、OLAP的需求。
与传统行业企业不同,互联网企业更加倾向采用各种开源数据库、数据仓库,从Hive、HBase、Spark、Impala,到Flink、Flum,针对不同数据不同访问需求,都有各种开源工具来解决具体的问题,互联网企业拥有优秀且庞大的技术人员筹备,对开源软件的稳定运行保驾护航,取得了令人瞩目的成就。
仅仅应用类型,就有键值、文档、内存、时序、图、分类账和宽列等多种数据库类型的区分,结合ML、DP等人工智能技术,数据库技术发展不断向前演进。
对此,国产数据库如何赶超?与此同时,针对GPL、LGPL、BSD、Apache等软件开源协议,如何避免知识产权纠纷,确保数据访问的安全和合规,这些都需要我们拥有自己的发言权。
作为技术创新的孵化器,openGauss开源社区上下求索,走出一条产学研用融合发展的新路。
小结
冰水为之而寒于水,青出于蓝胜于蓝。openGauss做为开源数据库,不但有数据库创新的代表,也是开源数据库高品质的代名词,颠覆人们对开源软件的认知和开源软件的定位。
openGauss开源社区任重道远。