Ceph是如何被广泛应用的?业界大咖有话说

众所周知,Ceph存储在红帽的推动下目前已扩展到支持容器和文件存储,对对象、块和文件存储同时具备很好的系统支持能力,Ceph在多台服务器上部署,是可处理PB级数据的统一存储系统,输出更高的性能和容量。从2004年起,Ceph从一个在社区里燃起的研究原型,发展成可运行大量工作负载的真实系统,并广为采用,是什么在助推着Ceph的发展?

日前,笔者在全球首届Ceph亚太峰会——Cephalocon APAC 2018的媒体沟通会上,再次采访到Ceph创始人、红帽首席咨询师Sage Weil,同时还有Ceph中国社区联合创始人孙琦,欧洲核子研究组织CERN的存储系统工程师、Ceph 顾问委员会成员Dan Van Der Ster,英特尔中国云计算战略总监、中国开源软件推进联盟常务副秘书长陈绪,海南易建科技公司服务事业群技术总监刘世民,以及红帽首席方案架构师张家驹,这些开源领袖对Ceph的发展与挑战分享了各自的真知灼见。

Ceph应势而生,快速演进

上次采访Sage还是在春节前(详见专访:Ceph亚太峰会落地北京!Ceph之父Sage Weil将首度来华 ),这次是Sage第一次来北京,也是首次正式来华,他表示,创立Ceph的初衷是为一个机房里面的超级计算机提供PB级存储方案,但过程遇到硬件出错、扩展性、伸缩性等诸多问题,OpenStack兴起后,发现这个项目的目标已经成了为云计算提供基础设施的概念,Openstack兴起后,Ceph从起先的文件存储,重点发力到块和对象存储上,形成支持文件、块、对象的统一存储,目前Ceph系统非常满足云计算计算中心的需求。最近几年的工作主要是做Ceph和其他不同组件的融合,得出的结论是——产品化才是唯一的出路。Sage提到,目前他更关注的是Ceph在性能、容易部署以及与第三方平台整合这三方面,而性能、好用、节能也是未来版本中要持续加强的。

作为Ceph的主导厂商,红帽首席方案架构师张家驹表示,社区和产品还是有区别的,社区比较发散,追求创新,而产品比较收敛,会收敛到不同的领域和不同的行业,去做一个企业可以使用的产品。从客户视角来看,企业版产品对客户是有承诺的,在问题解决方面,要把Ceph社区做得越来越成熟,生态越来越繁荣,对于客户的线上问题会有针对性的进行解决。像OpenStack和云这些新的场景,国内发展很快,但同时要认识到对新IT架构的接受不是一蹴而就,企业里还有很多传统的软件和应用,要求Ceph既能适应新型的、面向云计算的软件堆栈,也能对接传统的应用软件堆栈,Ceph在CERN和北美都有部署,更多是在云环境,而国内大量部署还是对传统软件堆栈,这是国外和国内最大的差别。认识到这样的差别,Ceph在最新版本里逐渐开始支持传统协议,我们将看到Ceph作为一个统一的存储平台,既可以适应传统模式稳态的应用,也可以很好地适应新型敏态应用,达到真正的统一。

对于Ceph在中国这些年的发展,英特尔中国云计算战略总监陈绪谈到,很多中国创业公司是基于Ceph来满足应用场景的需求,因为市场足够大,在竞标过程中满足了新兴业务的需求,而且可能与以前的专用存储设备黑盒子进行竞争。在这个过程中,无论是中国的创业公司,还是国外的创业公司,都在整个大潮中分得一杯羹,这也是他们积极参与和回馈社区的原因。

OpenStack与Ceph的关系

Ceph会逐渐演变成今天的OpenStack么?其实,从定位、设计和应用上来讲,二者大有不同。OpenStack与Ceph,CephCeph产生的时候云计算还不成熟,Ceph是随着OpenStack的兴起而逐渐为大家所用,Ceph的未来不仅仅只局限于OpenStack之上。“OpenStack是Ceph的一个应用场景,Ceph还有其他应用场景,比如容器、Kubernetes 。无论是OpenStack还是容器,都可以使用现在版本或者将来版本的Ceph提供存储服务,”Sage Weil谈到。

OpenStack的成长是伴随Ceph一起成长的,没有Ceph,OpenStack可能也不会这么潮。OpenStack是控制面,Ceph是数据面,这两个维度不断的向前发展。张家驹说:“对于技术趋势的把握,在这样一个大的背景下,我们发现控制面有逐渐演化的趋势,比如出现越来越多的基于容器的软件堆栈。但是数据面我们看到的只有Ceph,Ceph会不断的适应控制面的变化,对接新的软件堆栈,不断的适应新的应用场景。同时,Ceph也在不断的适应新型的硬件,使其应用越来越广泛。目前,Ceph在开源存储领域是一个非常火爆、非常团结的社区,所以有众多厂商参与,我们相信Ceph的明天应该比OpenStack还要更美好。”

Ceph中国社区联合创始人孙琦则谈到,OpenStack和Ceph的定位不同,Ceph在SDS领域里其实还没有强有力的竞争对手出现,相对来说Ceph提供的接口更丰富,可以帮助更多的应用快速的介入体系,所以它的地位或者说它的应用场景远远超过了其他的SDS产品或者开源项目。“大家现在看OpenStack,可能更多的是像一些市场的材料,看衰OpenStack市场,但是我们接触到的项目中,我是11年开始正式接触OpenStack,13年的时候我开始创业,当时我跟用户讲OpenStack,没有人能理解,当时费很大精力讲OpenStack,但是到了今天我们去找用户,我们要去投项目,你会看到标书写的就是我要OpenStack,所以我们通过这么多年的市场教育的过程,用户知道OpenStack是一个好东西,我认为OpenStack是进入稳定期的过程了。我们通过之前和OpenStack的整合,逐步发展独立出OpenStack之外的发展过程,这个过程是一个上升的过程,可能还没有达到稳定的阶段,但会持续上升。”

作为国内Ceph的用户代表,易建科技刘世民表示,国内OpenStack占比50%,但随着应用的互联网化,传统的架构升级为互联网架构,这时对OpenStack的需求需要转移,互联网化的应用需求更多一些,需要更新换代,Ceph在存储领域的地位可能短期要比OpenStack更牢固些,因为存储是每一个应用都需要的,而且Ceph天生就是分布式的,Ceph的明天还是非常美好的。

Ceph在超大计算集群中的应用

作为世界上最大型粒子物理学实验室,和万维网发祥地,CERN对于Ceph的应用备受业界关注,Dan Van Der Ster表示最开始CERN选择Ceph是从建基础架构层,选择OpenStack开始的,支撑15个PB的数据量,也考虑到经费问题,对于存储,Ceph应该是唯一的,没有第二个更好的选择的余地,将Ceph用于云平台后,发现Ceph还可以用于高性能计算和粒子对撞的计算,用CephFS文件系统提供高性能计算存储数据,整个过程运行了五年,数据从未丢失。Ceph的块存储在开源界举世无双,CERN存储的数据一年达到50个PB未来将发展到100个PB,量很大,但经费过低,只能选取通用型硬件,通过技术手段来提升存储容量。

张家驹表示,红帽之前的客户更多的是将Ceph作为云平台的统一存储。红帽Ceph在电信行业、政府行业、金融行业这三大行业有比较多的案例。其他的如制造业里也有应用实例,Ceph是一个基础架构层的东西,在各个行业里的应用场景是类似的,比如作为虚拟机的后端存储。

刘世民谈到,随着海航业务的发展,如何提供快速发展扩容的平台是首要考虑的问题,Ceph作为这个平台,是非常重要的基础,易建科技将它产品化。存储有两种形式,一种是Ceph的分布式集群,称之为海洋存储,另一块在一体机用了Ceph的技术,Ceph我们认为它有非常强的灵活性,大的可以用,小的也可以用,基于它开发产品形式。不光是海航内部用,也提供给其他的。整体上看,Ceph在延迟方面还是存在一些差距,很多的企业用户喜欢拿Ceph和SAN相比,SAN有很多特性,比如去重、压缩、同步和异步,Ceph在这块略有欠缺。

据统计,本次峰会共吸引了2500余观众参与,这次Ceph首次全球性峰会成功落地中国,预示着未来Ceph在中国发展的无限可能,Ceph自身在延展性和应用方面都将会有更出色的表现,拭目以待。