对话中国开源云联盟秘书长耿航:聊聊数据管理这件事

当前,海量数据不断地在云、数据中心以及边缘流动,多云数据管理是企业所关心的一个话题,我们也看到了越来越多有关多云数据管理平台开源解决方案,以及应用案例,作为致力于在国内推广开源技术的行业大咖,中国开源云联盟秘书长耿航,受邀参与本次百易堂的对话环节,分别从用户、厂商以及整个开源圈生态来聊聊数据管理这件事,并分析未来三年国内Ceph和企业级存储市场的发展趋势,数据管理、开源存储,这些也是2021年软件定义存储峰会的热点话题,看看今年有哪些行业趋势。

数据管理大咖说

对话嘉宾:耿航

中国开源云联盟秘书长、Ceph中国社区联合创始人、SODA基金会AC成员、中国电子技术标准化研究院木兰开源社区运营负责人

曾作为2019软件定义存储峰会特邀嘉宾,发表《中国开源软件的发展趋势》主题演讲。曾荣获“2018年中国开源云超级人物奖”,“2018年云计算开源产业大会-尖峰人物奖”,“中国开源云联盟2016年度杰出个人”荣誉,在云计算、大数据方面积累了丰富的实战经验。主导并参与国内Ceph相关书籍和标准的编写和校审工作,如《Ceph分布式存储实战》、《Ceph Cookbook中文版》、《Ceph分布式存储技术与应用白皮书》、《分布式块存储系统总体技术要求》等。

中国开源云联盟成立于2012年,致力推动国内开源生态建设,包括技术人才培养,国内开源软件的孵化推广等方面,同时也是国家云计算和大数据项目的主要组织之一。

数据管理技术多种多样,对于数据管理,传统企业用户会考虑哪些问题?

企业上云会考虑到灾备的问题,从传统的存储方式转为多云数据管理的思路,也会考虑传统存储设备利旧的问题,数据管理需求上升了,一些端到端的方案无法解决异构存储的需求,目前市面上没有一家能解决这个现状,传统厂商无法覆盖所有需求,而开源在管理产品生态上是一个比较理想的方式,比如开源项目SODA,除了可以解决异构存储的问题,也能够在数据管理、数据备份上做一些事情。

相关的SODA基金会,是Linux Foundation下的一个开源项目,是 Linux 基金会下第一个数据和存储领域的子基金会,主要解决企业用户 IT 基础设施架构在云原生和多云场景下的数据管理问题,以及数据存储的标准建设,目的是建立一个开放源代码数据管理和存储软件生态系统,从而实现数据自治。

对于数据管理,主流厂商主要分哪几类?

多云数据管理,说这个概念的有三类厂商,一类是做存储的厂商,第二是做灾备的厂商,第三类是做公有云的厂商,混合云发展的趋势,也是用户的需求。存储基础上,再做灾备的解决方案,在数据迁移上,带宽和时延上更好地满足用户需求。包括对边缘计算的应用,加速边缘端和中心云的数据流动,这些都是用户的需求。

商业存储和开源存储的天然区别?

商业存储只会针对一段时间的主流版本做Driver开发和监控测试,超出一定适配范围之后,就会有一些小毛病,这是商业产品和开源的差异,而开源是一个很好的做产品生态的方式,在开源社区,有开发人员不断地去改进产品,同时开源解决方案帮助企业节省大量成本。

Ceph作为开源圈的代表项目,目前在国内是怎样的发展状况?

Ceph在国内的热度一直不减,以Ceph做业务开发的初创公司也是不少,现在正逢新基建的好时机,将有更多的用户选择Ceph来优化存储系统,比如零售行业里的便利蜂等等。

Ceph为什么这么火?

2012年Ceph拥抱了OpenStack,OpenStack已成为私有云的标配,可以说Ceph搭了OpenStack的快车,是最兼容OpenStack的存储,这也是为什么很多有私有云部署的企业将Ceph作为后端存储的原因之一,Ceph在国内外有很高的用户使用度。

Ceph完美兼容OpenStack,我们也看到了很多基于Ceph存储的私有云平台应用案例,当然很多用户也会考虑成本上的问题,一开始Ceph初心是让用户花少的钱,得到更多的成效,随着硬件等因素的影响也会相应的发生变化,比如Ceph和SSD形成了标配,再比如和性能出色的傲腾内存的融合,单从成本上看的话,还是要看具体业务需求。

2018年 Ceph亚太峰会(首届软件定义存储峰会)之后,对开源存储圈产生了哪些影响?

回顾2018年,这是Ceph在全球范围内第一次举办的大型线下峰会,吸引了众多的国内外Ceph开发者做技术分享,之后也影响了很多用户,产生了很多新公司,当然也有问题提出,比如稳定性、数据的可靠性等一些初级问题,需要提升。稳定性上,其实不一定是存储本身的问题,很大程度上是人员操作流程上的问题。

未来三年,Ceph存储的发展趋势?

Ceph除了优点也有一些应用瓶颈,比如目前高端存储市场很少选择Ceph,始终停留在中端存储,目前Ceph自身也在做优化,包括与全闪的结合上,也在做相关的研究和探索。在应用上,Ceph也在适应行业需求,在不断递进式地发展。

开源存储是今年软件定义存储峰会一个重要话题,如何解读开源?

开源和任何领域都能结合,开源成为国内科技创新的源动力,是一种复杂的社会理论,影响了很多方面,包括企业内部制度的改革,企业内部组织的管理,启用开源,横向拓展,激发组织创新,避免闭门造车。

作为软件定义存储峰会的老朋友,今年会分享哪些内容,以及今年聚焦的几件事?

主要还是聚焦开源生态,今年会参与开源项目的孵化,中国开源云联盟正在组织成立存储专委会,包括存储方面的标准、白皮书等等,选出一些优秀的开源存储项目、以及项目的孵化,帮助项目走向国际化。

——END——

活动预告

2021年5月13日,由百易传媒(DOIT)联合Ceph中国社区举办的第4届软件定义存储峰会将在上海威斯汀大饭店举行,内容包括IPFS与SDS应用、开源分布式存储,数据管理与超融合,这些当下最热的话题,产学研专家汇聚一堂,包括高校专家的最前沿的课题研究,行业主流厂商带来的技术讲解,以及来自金融、制造等多行业用户的案例分享,感兴趣的朋友,欢迎到现场交流。

活动官网:http://sdss.doit.com.cn/2021/