DNSPod专访腾云忆想CEO香文斌,DevOps砸了中国程序员的饭碗?

采访时间:2021年4月22日
采访嘉宾简介:香文斌:腾云忆想科技有限公司CEO。2000年加盟腾讯,一直工作到2012年,期间从事网络建设规划和安全、腾讯安全中心建设、游戏运营和技术管理等多个岗位超过10年时间。2018年公司获得腾讯投资,注资成立腾云忆想科技有限公司,公司从事腾讯私有云于东区、北区的交付,主要方向在金融银行、智慧城市和政务服务、智慧零售、医疗和交通等私有云业务,继而衍生公司主打AIOps产品蓝鲸,主要方向为私有云的自动化运维方向的IT服务方案和产品。


采访主持人:吴洪声:腾讯云中小企业中心总经理,DNSPod创始人,洋葱令牌创始人,网络安全专家,域名及DNS技术专家,知名个人站长,中欧国际工商学院EMBA。

01

吴洪声:你作为腾讯53号员工“老鹅”,在10年的腾讯职业生涯中从事过游戏运营、技术管理,还有安全中心建设,腾讯发展到今天你觉得是因为什么?对于初创型企业有什么可以借鉴的地方?

香文斌:我有幸于2000年底加入腾讯,当时就在深圳华强北赛格科技园,那时候的腾讯只有几十人,随后经历的04年上市、搬迁到南山科技园、引入互联网增值服务、引入网游,抓住一次又一次的机会,我相信民间无数的对腾讯成功学的研究比我分析的更透彻,但以我个人的观点看,总结就是几点,一是在合适的时候沉醉于对产品的琢磨;二是琢磨这些产品和应用场景的人,是否都是符合公司当下员工所处人段需求的。我觉得对于初创企业最大可以借鉴的地方是;做自己擅长的、有经验的、你的工作人脉和资历沉淀最深的那个领域就好了。

02

吴洪声:很多今天的年轻人会认为,互联网的红利期已经到顶了,现在的95后、00后进入互联网行业已经无法像80后这一代人一样吃到这个行业的红利了,作为他们眼中的幸运的一代,你怎么看这个问题?

香文斌:我倒不是这样看待这个问题,我认为新生代事物和它能代表的思想还是会引领一些新科技、新潮流、新的资本追捧的。就像今天的短视频、直播带货、网红模式、所有的自媒体内容生产者们,他们都正在以惊人的速度在积累自己的人气。我所理解的红利也许只是过去20年平台型的红利,现在的95后、00后进入了新的领域,他们可以是在这些平台基础上产生内容,他们会是最大的受益者。

03

吴洪声:在离开腾讯之后,你也多次的创业,担任区技公司CEO。现在做的是私有云的自动化运维相关的事情,关于职场身份属性的选择和行业赛道的切换,你有什么做抉择的经验可以分享吗?

香文斌:是的,我于2012年离开腾讯后,其实是有点故事的,当时09年开始我投资了富途。创始人Leaf是我在腾讯时候第一位我的leader,也是我的导师和偶像,投资也是基于各种机缘巧合吧。他创立的公司磕磕绊绊起步和壮大,其实我也想试试,所以我就出来了。在后来的经历里,我们做过游戏的研发和发行,各种踩坑,游戏也做到了上微信发行,但是没有量没有赚钱,商业模式设计也不好,很难。直到在腾讯云生态里成为最底层的人力合作伙伴起步,到后来的腾讯云布局的四大区域技术支撑中心。我们入了这个局,这对在我们整体的团队的实力、技能上的补充、项目与商机的视野、企业服务的理念,都发生了非常深远的影响的。


如果说有什么最深的感想分享,我觉得还是那句,做自己积累最深的行业。我认为私有云的发展,已经让运维、各种DevOps、AIOps、自动化运维等,都拉到了这个专业领域新一轮巅峰的需求去了。这对于过去20年做运维的小伙伴们来说,是一个时代的福音、是好事,也是数十年难得一遇的好时机。

04

吴洪声:可以简单介绍一下,区技的模式是什么样的模式吗?当前云的发展日新月异,你的团队也正与腾讯云开展战略合作,能简单介绍一下合作的模式吗?

香文斌:区技的全称是区域技术支撑中心。首先解释一下大背景,腾讯虽然有很多国民级的应用,但是在ToB的服务上,从业者和生态的数量是不足的,这也是腾讯云的超高速发展造成的,为了解决这个问题,开创了区域技术支撑中心的模式。

区域技术支撑中心是腾讯云的重要组成部分,由腾讯投资,联合在ToB领域有丰富经验的核心团队,首要任务是让腾讯云的产品能够更好的服务于客户,协助客户完成云时代的信息化转型,另一方面在腾讯云的产品实践过程中积累经验,持续在产品和服务上创新。

这是腾讯云投资我们产生的新主体,我们公司叫腾云忆想科技有限公司,按腾讯云四大区域划分,我们是比较特殊的,同时负责东区和北区的业务,正式职能是负责腾讯私有云来说,就是我们的人投入到腾讯云在商务、售前、交付、售后的各个阶段去,既需要为人力负责,也需要为交付质量和客户满意度负责,同时还兼顾腾讯云内部各种技术岗位认证的专业体系建设。

05

吴洪声:你的团队在两年内已有非常高速的增长,你怎么看这么快速成长背后的逻辑,以及会带来什么样的挑战?

香文斌:确实是很快的,从18年12月7人起步,到如今在区技公司有1000人的体量,也就是2年多的时间,的确很快。这中间的逻辑首先是腾讯云业绩飞速的扩展,市场份额的扩大,腾讯云行业影响力和口碑的提升,无不相关。

但是在快速扩张的同时,我们看到了各种成本的压力,比如人员流动性带来的管理压力、人员晋升和福利以及技能要求带来的严重冲突,以及一直处于供不应求的状况下,人员持续高强度劳动带来的各种压力。我相信这在2021年会是一场很大压力的战役。

06

吴洪声:区技未来的发展和方向会是怎么样的呢?腾讯又是如何对你们提出要求的?

香文斌:腾讯的要求其实是多方位的,一方面,腾讯最大的诉求还是要以高质量的工程,完成私有云的部署和解决技术性的问题。另外一方面,区技由于这样的工作模式,在地域性的布局、人员成本的考虑、如何老带新的要求上,就会越来越的高要求。

区技的未来,我们探讨过一些方向。比如大量成型的咨询方案形成的价值,又或者是专门对腾讯云技术方向的数十种专业认证培训,也可以是一些金融、政务、零售等多方面,行业私有云的后续运维的全方位人力和系统的需求等等,这些都会是我们的方向。

当然,区技最大的使命,依然是腾讯云自有高标准产品的交付和运维。在这方面,最重要的是成本、成本、还是成本。以老带新的培训体系来降低成本、快速提高人员的专业认证、完善项目交付的各种环节,依然是使命级的持续任务。

07

吴洪声:DevOps作为一个热门的概念,近年来频频出现在广大群众的视野中,也备受行业大咖的追捧,同时也吸引了吃瓜群众的围观。有人说它是一种方法,也有人说它是一种工具,还有人说它是一种思想。更有甚者,说它是一种哲学。越说越玄乎,以你对it服务方案和产品的经验,能和我们介绍一下DevOps这玩意真的有那么夸张吗?它到底是干嘛用的?

香文斌:记得还是10多年前,当时我还在腾讯的时候有个大型综合项目,我们从开发、测试、发布、扩容,整个环节下来投入了30多个人力,耗时接近3个月的时间,这3个月项目组的每个人都感觉每天是在打仗。复盘探讨后,在项目二期的时候逐步引入DevOps,虽然中间经历了很多的改变、磨合,但结果是我们只需要投入10个人,1个月的时间就可以把这个事情完成。

DevOps能被越传越玄乎,正在于其影响力的与日俱增。现在不仅互联网行业引入DevOps,金融、电信、政府也都在把DevOps当做核心能力来进行建设。当前所有IT从业者也都在把DevOps作为自己的必备技能。

08

吴洪声:DevOps它从根本上背离了传统笨重迟缓的瀑布式软件开发方法。企业发现它解决了传统的软件开发方法导致额外开发时间和成本,在开发和操作之间架起了一座桥梁。一时间所有人都想“做” DevOps 并期待其能为他们带来商业上的成功,但却对 DevOps 的核心理念知之甚少。这很大一部分原因是市面上对 DevOps 有着各种各样的说法,导致大家概念的混淆,作为一个新的概念,却已经得到了广泛的应用,它爆火的背后原因是什么?DevOps到底摸到了企业的什么痛点?

香文斌:随着云计算、微服务、人工智能、移动互联等技术日新月异,技术以十倍速的向前演进、迭代,随之而来的应用、系统复杂度也呈几何式增长。

当前部分企业,工作进程耦合度较高,不能实时地对需求的变化做出反应显得笨重。DevOps可以打破已有的烟囱模式建设方法,并能不断沉淀企业的能力,而且可以自主可控,实现灵活的场景构建。

从2017年DevOpsDays大会北京站举办以来,DevOps在国内进入快速发展期。DevOps不仅提高了IT工程师的幸福指数,更为企业带来了快速、持续交付高质量产品,满足用户多样化的需求,并有助于提升企业的利润和市场占有率。

09

吴洪声:乔布斯有句名言:“消费者并不知道自己需要什么,直到我们拿出自己的产品,他们才发现,这是我想要的东西”。你在2018年就成为腾讯云战略生态伙伴,深耕DevOps和蓝鲸产品这个行业,那个时候市场其实并不成熟,你是如何嗅到这片广阔的蓝海的?

香文斌:其实并不是单纯的嗅到了。是腾讯云高增长的需求,让我们有机会成为深度的合作伙伴。另外,我在腾讯的工作经验里,对于运维场景非常了解。如何打造监控系统,如何在一个有多方协同的工作环境里,参与到有体量的系统或产品项目中去,并且囊括研发、测试、发布和代码自动化的一系列过程都感受一把,加上在游戏的服务里持续的故障自愈、数据的冷热备、还有游戏服务切换的高要求,其实这些都在我脑海里形成对这一领域的持续感觉。可以说,我们从来没有离开过这个专业领域,所以基于对现在众多私有云平台交付和运维的经验看,DevOps和蓝鲸,也会是以后我们主攻的赛道方向之一。

10

吴洪声:DevOps的落地和广泛的应用,使得软件交付速度也达到前所未有之快,有人认为减少测试、开发、运维实际精力的投入可能会带来安全问题,更快最后导致“更慢”,使用DevOps引发安全隐忧问题变得更加需要被重视。你如何看待这样的观点呢?有什么方式可以解决使用者的担忧呢?

香文斌:引入DevOps后会带来哪些风险、不确定性?估计大家都有思考这个问题。

新技术、流程、平台的引入,再加上现代架构的动态本质,常带来风险及不确定性。例如权限管理不善的风险。DevOps可能会选择在项目开发期间对数据库及存储容器内的敏感数据进行开放访问,并在随后逐步划定权限范围。这就是所谓“先运行、再修复”的思路。但现实情况是,只要不出问题,“再修复”就只是一句空话,因此敏感数据可能持续对未授权身份开放。

自动化评估、跟踪和预测“DevOps”的运行是必要的。例如权限管理风险,核心在于建立一份问答清单,标记出清单内的关键性合规与安全问题,借此优化身份管理。将清单实现为安全适应度函数集,我们可以实时观测到当前与期望或可接受的结果之间存在偏差。

我们需要一套完善、与时俱进的评估机制,来评估快速变化对安全的影响,并防止这些评估特征随着时间的推移而退化。适应度函数涵盖多种机制,包括度量、测试和其他检验工具。全面的安全适应度函数集合就被用来构建安全体系,将帮助企业内的开发人员建立起完善的预防措施。

11

吴洪声:DevOps要求的是平台之间的打通,而对于一些保密性需求较高的企业,例如银行、金融机构等,他们要求对生产测试开发环境物理隔离,在你看来,对于这样的企业,如果希望使用DevOps,应该如何平衡两者之间的矛盾呢?

香文斌:可能组织中的人很难理解DevOps,因此安全机制可能会造成更多困惑。生产和非生产,一般都会做物理隔离,部署两套集群,确保产品的质量和运行风险。

本问题看似是平台互通带来安全风险,其实问题核心的诉求是:保密性要求高的企业如何做到CI/CD自动化,也就是在高安全合规需求时,如何进行更安全可控、敏捷的变更。

答案是可以通过全面的安全策略进行保障,例如从策略、流程、工具、培训四个维度进行安全左移;使用制品库进行组件版本溯源;对制品库进行授信等;通过制品库打通Pipeline,覆盖日常所有变更细节。

我们在做金融客户的时候也发现,客户对安全性、规范性要求比较高。我们公司已经和华佑科技签署了战略合作协议,帮助金融的客户按照信通院的标准建DevOps体系。DevOps能力成熟度模型分为8个标准,5个等级。目前这个标准通过的企业有农业银行、招商银行、浦发银行等。

12

吴洪声:一些传统行业,例如能源业务系统升级更新慢,在你看来,DevOps产品对于他们有价值吗?目前据我了解,其实这部分企业对DevOps可以说是知之甚少,如果希望开拓这一部分市场,你会如何寻找切入点?

香文斌:对于传统行业,数字化已成为共识,“加快数字化发展 建设数字中国”并写入了政府十四五规划纲要。

DevOps是企业数字化的一个抓手,通过减低价值流全链路的损耗,为企业带来了快速、持续交付高质量产品,满足用户多样化的需求,并有助于提升企业的利润和市场占有率。这也是我做DevOps的初衷。

腾讯的DevOps最佳实践蓝鲸,在整个游戏行业非常知名。传统企业上云之后,面对『云』这个新兴事物会不知所措,特别是出现业务突增以及故障的情况下,传统企业会束手无措,所以更应该需要互联网的经验,特别是DevOps方面的经验。

记得我们曾经做过的1个项目,客户是传统企业,他们上云之后,经常遇到业务出现故障,从员工到技术主管,每个人都在疲于救火,非常被动。找到我们之后,我们根据客户当前的现状,引入DevOps,先把客户的监控做起来,客户能够实时掌握业务的运行状况,从以前的被动救火,现在变为了主动优化。

对于传统企业,服务供应商、产品线等比较复杂,故障的快速恢复挑战比较大。我们从监控领域切入,从业务、资源全链路监控入手,帮客户第一时间诊断问题,再借助CO进行数据分析,做好风险管理及辅助决策。然后通过获取拉通行业数据,利用AI大数据,挖掘有效信息,刻画业务画像,分析客户业务价值流全链路,开发更多有针对性的产品和服务,更精准的帮客户减少创造价值流过程的损耗,通过数据洞察成就客户业务快速增长。