一、
今年八月底的时候,一位将近一年没见的基友小唐主动约饭,当我见到他的时候我略有些惊讶,在近一年来,他的好身材已经被发福的肚子所取代,而头发也已经变得稀疏起来,整个人显得非常疲惫,他见到我的第一句话就是:
「我真的不行了……」
两年前他从大学毕业的时候进了一家颇让人羡慕的国企做运维工程师,也就是从那时候开始,我就很难再见到他。公司的运维工作非常重要,规模也很庞大,任务也非常重,但却只有少数几个人在负责,这几个人起早贪黑三班倒,有时候睁眼是黑夜,有时候睁眼是白天。下班的时候他几乎都在睡觉,根本不忍心约他出来玩。两年来,他的生物钟已经完全被打乱,也导致出现了一系列的生理问题,内分泌失调导致身材走样、头发狂掉、精神集中不起来,记忆力减退,在聊天的过程中,他也好几次走神,我觉得他如果再继续做下去迟早会问题。
其实,小唐只是国内运维工程师的一个缩影,在各大企业以及互联网公司,整个系统平稳有序地运行至关重要,出现任何一个小小的问题都可能导致致命的结果,给企业造成损失,这时候不仅仅是被领导劈头盖脸痛骂的问题,甚至都有饭碗被砸的可能。然而更为郁闷的是,当一切都平安无事的时候,却没人会在意他们的付出。
难道,运维人员的生活就非得这么苦逼吗?
「哪个程序猿不想面朝大海,春暖花开,写写代码,自由自在?」当我在采访云智慧CEO殷晋的时候,这句话他和我说了三次。
在之前参加一次媒体沙龙的时候,殷总也正好在场,他讲了一个故事,他还没有创业的时候,所在的公司用百万美元收购了一家英国的小公司。与其说是个小公司不如说是一个夫妻店,丈夫是程序员,夫人是设计师。虽然代码写得很一般,但是两个人却有着年薪五十万英镑的收入,生活在一个非常舒适的小岛上,真正地「面朝大海,春暖花开,写写代码,自由自在」。
于是问题来了,为什么中国的很多程序员虽然也都实现了高薪,但生活得却非常压抑和苦逼,就像我的基友小唐,技术能够改变世界,为什么却不能改变程序员的工作和人生呢?
所以,现在像云智慧这样的产品就是为了改变程序员的世界。
二、
云智慧是目前国内领先的应用性能管理服务提供商,为企业级用户提供面向业务的端到端应用性能管理(ApplicationPerformanceManagement,缩写为APM)服务,已经为众多行业用户提供性能监控和管理服务。现在旗下有监控宝和透视宝两个产品,具体来说,「监控宝」可以实现对网站、API、服务器的可用性、稳定性提供多种形式的监控和告警,而「透视宝」则是去年云智慧发布的一个新产品,它是新一代面向业务的端到端的应用性能管理平台,不论是App还是Web,透视宝可以以真实用户体验的视角,基于大数据的分析,为企业提供实时的性能监控、分析与管理解决方案。
如果要通俗易懂地解释一下,用殷总的话来说,就是云智慧解决了网络服务的「断」和「慢」的问题。所谓「断」,就是防止网络出现问题,目前云智慧在全球将近200个城市部署了网络监控点,通过当地网络随时监控网站、API接口的可用性以及网络传输情况等各个方面的即时状态,如果又有什么挖掘机挖断了光缆,监控宝可以第一时间知道问题出在哪儿了。
而所谓「慢」则是帮助企业解决整个应用系统缓慢的问题。就和我们自己的电脑一样,企业的IT系统也会时不时地会出现运行缓慢的问题,而透视宝就是不断地深入扫描整个系统,从用户端一直到服务端,甚至哪一行代码出了问题都可以扫描出来,并给予解决方案,就像医院给病人做CT一样。
三、
就像在今年9·3大阅兵的时候,很多人在通过网络观看直播的时候,都遇到了视频直播加载失败的情况,对于这种万众瞩目的事件来说,直播上出现这种失误是相当严重的。每逢重要事件或企业策划的大型活动(如天猫双十一大促),运维部门的压力相当之大,不仅需要保证业务的流畅性和连续性,还必须及时解决任何突发问题。
特别是随着云和移动互联网的发展,IT运行环境越来越复杂,传统的运维方式就显得有些力不从心,尤其是在问题查找方面尤其明显。由于生产环境中的故障难以重现,所以排查运行日志是大部分IT运维人员查找问题根源的主要手段,但这样做的弊端就是速度慢,效率低,特别是面对海量运行日志时,这简直可以称得上是一场灾难。长此以往,整个平台频发的性能问题和差劲的用户体验,势必造成用户的大量流失,并让业务蒙受巨大损失。
所以,只是被动的发现问题再解决问题颇有种「马后炮」的感觉,对于一些互联网公司的产品运营、运维工程师们来说,找到问题并解决问题并不算太难,难于你要在出现故障的第一时间定位问题的根源并知道解决的办法,进一步,如果你能够提前预知哪里会出现问题,并在有可能出现问题的时候及时提醒,就能够避免灾难性的后果。
实际上,这种问题并不是不能解决,像云智慧提供的APM产品「透视宝」就能从「根本上」发现和解决问题。比如在系统平稳的时候,它可以一直扫描整个系统,指出系统存在的潜在问题以及可能产生的故障,报告给运维人员以便及时解决问题并优化系统,提高企业应用的可靠性和质量,保证用户得到良好的服务,降低IT部门的成本,也能够让运维人员得到解脱。
四、
就在采访殷总的前一天,我厂看起来「稳定」的后台让我「损失了」将近8000+字的稿子,我就像往常一样在后台编辑器写稿、提交,本该正常发布的稿子却少了将近3/4的内容,当时的我心情非常崩溃,有一种想冲下楼把服务器砸烂的冲动。
然而对技术百思不得其解的我也不能发现到底是什么样的问题,一穷二白没有独立工程师的我厂也不大愿意总是骚扰提供「友情支持」的「好心人」。到了晚上我才想起来导致问题的罪魁祸首是因为我在文中插入了一个emoji表情符号,而我厂的系统没有办法识别和兼容,导致emoji后面的文字全部丢失。
殷总听了我的遭遇后说如果你们使用云智慧的产品,一秒钟就能发现这种低级技术问题并给与解决。(泪奔)
现在,投资界的「风口」很多,所谓O2O、P2P以及各种「互联网+」已经成为当红炸子鸡吸引所有人的目光,然而当风散潮退的时候,谁在裸泳一目了然。我坚信真正的「风口」和「创新」,并不是那些看起来很美丽,一旦激烈竞争来了又没有补贴的时候就随风而逝的东西,而是「真正」能提高行业生产力的东西,「2B领域」就是代表。
五、
所谓的「2B领域」也被称作「企业IT服务」,和传统的IT服务不一样,目前的2B服务都是在「云端」,具体来说有三大领域:云基础设施服务、IT工具以及应用软件,简单来说。云基础设施服务就是发电厂,IT工具就是电线、变压器、电网等配套软硬件服务,而应用软件相当于电灯、电视、电冰箱等用电器。
如同这个例子,企业IT应用的明星往往是「家用电器」为代表,因为这些产品面向的用户最多、最基础,用户基本不要懂得产品实现的原理就能够方便使用。比如企业IT服务的超级巨星Salesforce市值已经逼近500亿美元,让在CRM领域耕耘多年的微软措手不及,在软硬兼施都失效的情况下只能以亲密合作示好。而像阿里云这样提供基础设施服务的巨头则在强大的宣传之下同样成为大牌明星。而只有夹在中间的「IT工具」则显得略有些默默无闻,如同运维工程师的悲剧,只有出问题的情况下才能想起来还有这样的一个群体。
云智慧就是这个群体里面的代表,他很重要,却鲜为人知,就像我的这篇文章以及整个reMake专栏一样,即便是能写出花儿来,也仅限于行业内人士看看(如果说我这个专栏如果是写大家每天都在用的手机数码娱乐产品保证刘浏览量超高)。
然而殷总却很乐观地举了一个例子,当年在美国西部形成「淘金热」的时候,真正的淘金者并没有赚到钱,而发财的则是卖铁锹铲子牛仔裤等「工具」的人。确实,当应用软件的的创业者在做产品的时候发现,各种各样的「工具」不能缺少,甚至发现,当产品做到一定规模的时候,工具的重要性反而更加重要起来,那么应用性能管理的问题就成了核心问题。
但是对于创业者来说,应用性能管理很重要,而节约成本也很重要,所以当有云智慧这样提供APM服务的「工具」时,就能够同时兼顾「鱼和熊掌」,既能享受到优质和专业的应用性能管理服务,也能节省IT人力成本。
六、
随着IT云化和移动互联网化的深入,APM的价值逐渐体现了出来,因为它能够真正地帮助企业提高效率和稳定的服务,尤其是在企业IT服务发达的美国,提供APM服务的厂商超过40多家,尤其是NewRelic(NYSE:NEWR)已经成功在纳斯达克上市并成为行业标杆,现在NewRelic的市值将近18亿美元。
在中国提供APM服务的只有云智慧、老牌IT服务厂商听云以及oneAPM。殷总认为和竞争对手相比,云智慧的优势在于,第一是产品更新迭代和响应市场需要的速度比较快;第二是自身的技术能力比较强,全部是自主开发,技术上处于国内领先地位,和国外的同类公司相比,“云智慧”的产品经受过更大规模的峰值考验;第三是云智慧的产品更注重用户体验,和其他产品相比,云智慧会进一步分析问题出现的原因,从每一个环节检测问题出现的地方,而不仅仅是给出一个警告或者告诉你有一个问题。
殷总也认为,现在国内的APM市场很大,但还在沉睡,需要教育市场来让更多的人发现APM的价值,当企业尝到好处的时候就发现已经无法离开APM。
云智慧作为其中的一员,目前最重要的使命就是精心打磨产品,只有云智慧的产品不出问题,客户的产品才能不出问题,更重要的是,只有这样,程序员同学才能:
「面朝大海,春暖花开,写写代码,自由自在」。
最后……
本文开头提到的我的基友小唐后来终于下决心辞掉了之前的工作,进入一家购买了APM服务的公司,在刚刚过去的十一黄金周,土豪唐自己一个人飞去巴厘岛「面朝大海,春暖花开」,如果监测到系统可能会出问题,只需要收一个短信「改改代码,自由自在」。不过希望他的头发还能长回来。
这真的是一个真实的故事。