当我们说到OpenStack的时候,我们在说什么?

       我可能是为数不多亲手安装并体验过OpenStack的媒体从业者之一。
       两年前,我原来所在的公司准备搞一个评测实验室,希望能够为客户提供精准、完善、权威的评测服务。作为公司内的“技术专家”(请注意这里的引号),这项重任无疑落在了我的肩上。不假思索的,我就选择了当时大热的OpenStack平台。
       现在回想起来,当时决定采用OpenStack的决定或许有点草率,因为我对于Linux系统的确是一无所知。不过在请教了业内若干技术人员的指导和支持后,系统部署与安装倒是进展顺利,当所有服务器都连接为集群的时候,我还是有一点点小激动。
       不过好景不长。几个月后,部署的环境发生了变化,增加了几台新的设备,一些网络设置也需要调整。于是乎,仅仅是因为数据中心的设备换了个位置,更换了IP,我就又莫名的干了大半天的时间,才把系统搞定,其中的“艰辛”更是不足为外人道。
       讲这个故事,我无非是想说明曾经的OpenStack在应用上有多么困难。对于我这样的爱好者来说,虽然听过许多前辈讲解OpenStack的相关技术,虽然也曾与那些业内大咖们采访、聊天、谈笑风生,但在真正动手实践的时候,才知道去其中的艰难。
       当然除了界面是否的友好、功能是否完善、是否能让初学者尽快上手之外,系统的“强壮性”也是许多用户需要考量的范畴。如果仅仅像我这样需要迁移或者扩容,就导致系统的问题,这样的情况肯定是大家难以接受的。特别是对于那些大型企业用户来说,稳定与安全始终是他们考量的核心内容。
       不过好在如今,OpenStack已经“长大”了。
     “扫地大叔”险酿悲剧,OpenStack“坚强面对”
       在上个月举行的OpenStack Days China 2017大会上,就出现了这样戏剧性的一幕——在现场的演示过程中,一位“扫地大叔”冲上讲台,贸然拔掉了正在演示的系统电源。除了演示人员之外,现场的上千位观众都被这位“大叔”所震惊,发出了阵阵惊呼。只有演示者不慌不忙的插上了系统电源,在经过短暂的启动之后,系统恢复如初,并没有因为断电受到任何的干扰。
       看到这里,观众不禁莞尔一笑,随即现场爆发出了雷鸣般的掌声。显然,这是一幕经过预先准备的实时情景再现,而现场的结果也足以说明,那个被人误解与质疑的OpenStack已经今非昔比,它实现了自我的成长与完善,变得足够“强壮”。
       这可能不仅仅是一场情景剧或者一个Demo演示,在真实的情况中,类似的事情时有发生。就在刚刚过去的8月15日,仅仅因为工作人员的误操作,导致了全台湾地区17个县市大规模停电,影响了超过668万户用电。由此可见,“误操作”这种事儿在各行各业也是屡见不鲜,对于关乎企业乃至社会应用的IT行业来说,尤其需要得到重视。
       根据数据中心性能研究机构纽约正常运行时间学会(UPTIMEINSTITUTE)所提供的数据显示,目前人为失误引发了大约70%的数据中心故障,特别是对于许多中小数据中心来说类似的情况并不罕见,这也就成为了情景剧策划众人的素材来源。正如一部热播剧需要从编剧到导演再到演员等人士的共同努力一样,想达到良好的演示效果,也需要集思广益。
       在谈到这个创意的时候,担任本剧导演,来自Intel公司的Maggie Liang(梁冰)女士表示,希望通过本剧让大家更清楚的了解到OpenStack快速升级和断电重启的特性,帮助用户树立对于OpenStack技术领先性与应用适应性的认知,突出OpenStack的“成熟”特性。
     “我们邀请到了基金会主席来出演‘清洁工’这个角色,也是希望增加戏剧效果。Alan Clark非常欣喜的接受了这个角色,同时跟我们一起完成设计环节,最终给全场观众留下了深刻的印象”,Maggie Liang说。
       事实上,包括副导演金运通(来自Intel)、冯军(来自九州云)、编剧陈沙克(来自九州云)、演员宋毅良(来自Intel)、曹威(来自九州云)等一众志愿者都从不同角度对本剧进行了解读和丰富。也正是得益于这些志愿者的支持,才让这部剧从技术到艺术,从应用到意外的各个层次表现得淋淋尽致。
       应该说,自OpenStack诞生以来,业内的质疑便不绝于耳。一直以来阻碍OpenStack被用户广泛接受的一大障碍是OpenStack复杂的安装与运维,没有专业的OpenStack技术团队,部署运维OpenStack云平台可以说是困难重重。
       但是,随着今年Ocata版本的推出,这个问题得到了极大改善,用户应用的便捷性也大大提升。而此次,大会现场向与会观众演示OpenStack集群断电自动恢复这一常见故障,就是希望通过野蛮操作反衬OpenStack的稳定和易于维护,也是“扫地大叔”设计的初衷。
       中国有句老话,叫做“耳听为虚眼见为实”,这一次在几千人面前演示的断电重启,充分说明与印证了OpenStack在品质上的高可靠性。
      Kolla,OpenStack的“增肌粉”
       既然OpenStack经过了多年的发展,为什么唯独到了今年的Ocata版本才有如此大的进步?在这里我们需要类比一个概念——增肌粉。
       在健身界,如果一位选手想变成标准的“肌肉男”,就必须服用一系列高效的补剂,比如“增肌粉”;同样,对于曾经“孱弱”的OpenStack来说,正是Kolla的出现让OpenStack变得如此“强壮”。从这个角度来说,Kolla就是OpenStack的“增肌粉”。
       简单来说,Kolla的作用就是负责Docker的镜像制作。我们知道,早期的OpenStack是不支持容器化的(Docker),但是随着Docker越来越成为主流,不能够容器化的平台或系统必然会面临淘汰的命运。所以在这样的情况下,OpenStack才将Kolla纳入其中,实现了又一次的自我“革命”。
       作为演示者,在面对考验我需要表现的是从容淡定,而这份从容淡定是来自于对OpenStack的自信——演示者曹威
       另一方面,Kolla的最终目标是为OpenStack的每一个服务都创建一个对应的Docker Image,通过Docker Image将升级的粒度减小到Service级别,从而使升级时,对OpenStack影响能达到最小,并且一旦升级失败,也很容易回滚(这也就是为什么我们看到系统可以自我恢复)。
       相对于以往,在Kolla项目中系统升级只需要三步:Pull新版本的容器镜像,停止老版本的容器服务,然后启动新版本容器。回滚也不需要重新安装包了,直接启动老版本容器服务就行,非常方便。
       在谈到技术优势的时候,Kolla项目核心开发者,来自九州云的张雷这样认为:“Kolla不但有效的简化降低了部署依赖问题,而且可以实现快速部署,也大大降低了维护的难度。比如对某个服务修改代码,安装依赖包的时候,不用担心会影响其它服务的运行,同时也使 OpenStack 在线升级变的简单和容易”。
       同时张雷也表示,无论是Docker还是OpenStack都有着各自的优势,具体的应用情况还是要根据客户的业务场景来分析。
      七年之痒,OpenStack的未来在何处?
       在与这些志愿者的聊天中,我觉得受益匪浅。
        在此之前,我对于OpenStack有很多的不解:代码贡献率代表了什么?那么多的金牌、银牌赞助商有什么意义?市场呼声这么高,又有多少人真正采用了这项技术?
       我相信这也是许多人心中的疑问。至少从今年来看,OpenStack的呼声似乎并没有去年那么火爆,话题的讨论热度也有所下降,一切看起来都是“衰退”的情况。但是刚提到这个问题的时候,平常看起来温文尔雅的Maggie Liang就像爆豆一样表达了自己的观点:“如果说“火爆”是指关注这个技术的讨论的热度没有那么火爆,我觉得这刚好印证了这个技术正在逐渐走向成熟”。
       在她看来,两年前行业对于OpenStack的热议,正因为大家对于这个技术是否能够承担起大型企业云平台建设而有诸多的讨论。而如今热议渐渐归于平静,则是因为已经有像国家电网、移动、电信、联通、银联、铁路、中海油、中石化等一大批超级用户选择了OpenStack来实现企业级云平台的管理和建设,曾经的热议早已经变成了埋头苦干。
       同时,从近两年的OpenStack Days China火爆程度上,我们也可以看到一些端倪。从未有任何一场大会能够邀请到如此众多的国有及超大型企业发言人共同登台演讲,这本身也就反应出了OpenStack在中国的受欢迎程度。相比于前几年的“敲锣打鼓”来说,OpenStack更进入了“闷声发大财”的阶段。
       写到这里,我想回到标题那段文字——当我们说到OpenStack的时候,我们在说什么?在此之前,我们可能谈论的是某项技术、某种担忧甚至某些失望,但是从今以后,我们更多谈论的应该是如此便捷、如此简约、如此强壮。
       我想,如果真能这样,就意味着OpenStack的确成功了,可以真正的落地,生根,开花,结果。