听云APM:新经济环境下的精益化应用管理

2017年3月23日,第八届中国金融云高峰论坛在上海盛大召开,来自国内外政府机构、行业协会、金融银行的首席信息官、数据中心经理、软件开发主任等齐聚一堂,针对银行业新核心系统开发、中小银行如何把握金融创新、大数据技术在银行数据中心的建设等多个热点话题展开讨论,听云华东技术总监王凡就传统金融的互联网转型在会场与现场观众进行了相关分享。
以下为演讲内容:

一、2017年金融市场的三大热词

非常高兴有机会能够和大家一起探讨一下在新经济形势下精益化的应用性能管理。听云APM:新经济环境下的精益化应用管理-2017年经济将会有些变动,前段时间刚好两会召开,我上网搜了几个热词可能和我们有点关系。一个是普惠金融,普惠金融其实喊了很多年,这是国家对金融行业的一个要求,要求金融行业做更多的业务,提升服务的有效性和加大对中低端用户的覆盖面,这是一个很好的要求,但是这个要求的问题是传统银行是否能适应这种变化。对传统金融来说,在这方面做的是不足的,甚至已经被很多互联网金融公司渗透并抢走了很多用户。

另一块是互联网+,“互联网+”是在新经济环境下对传统金融提出的一个新的要求,不是说传统金融主动想做“互联网+”,而是当前的经济条件要求必须做“互联网+”。那在这种情况下,就会发现传统金融在这方面没有积累。其实都能看到大多数的传统金融还是基于很陈旧的思维方式在做,虽然也有尝试在做互联网、做一些拓展,但是实际的效果并不好。

还有一块是情景式商务,情景式商务是这两年比较火的话题之一。大家都在说传统金融业要提供更好的服务体验,让客户能够得到一些更好的服务价值,提升服务黏性,让他成为忠实客户。那么在这种服务优化的过程中有一个问题,就是一款应用,这个应用怎么才能让客户感受到好的服务体验,这就是要考虑的内容。那么怎么来提供更好的服务呢,这就要看一下大环境。

二、面临金融蛋糕的切分,不要坐在金山上要饭听云APM:新经济环境下的精益化应用管理-我们发现,在很多情况下传统金融留下来的意义就是信贷这一方面了,包括一些个人理财,但是这一方面也被现在很多的中小型互联网金融公司冲击的比较厉害,那么如何适应这样的变化就需要去想办法,否则的话就会像上图写的,在金山上要饭。这个标题是从哪来的呢,这句话是我看了埃森哲对中国金融的一个评估报告,报告里面有这么一句话让我印象很深刻。的确是,我们拥有这么大的体量,有这么好的一个基础,为什么不能把业务做得更好。

那金融的业务到底是什么样子?普惠金融、“互联网+”,这些已经在金融行业提了很多年了,但是需要看实际业务。

三、为什么要做精益化应用管理?传统金融遇到的问题

现在从大环境来说,未来所有金融的竞争不会再去说有多少个柜员机,多少个分析机构,可能更多的是存在于客户端的竞争。因为现在的用户已经越来越习惯于通过手机来做理财、转账等各种各样的业务。那这种用户在客户端使用业务的体验就直接决定金融机构的服务质量是否能满足业务的需要。那么从目前看到的数据来说的话,大多数的银行所提供的这些服务终端的用户体验都是不太好的,原因就在于对于整个“互联网+”这种新的挑战还不够适应。
但是做银行、做金融运维保障是做的时间最长的,银行有很大的团队,有很长时间的数据积累,但是为什么在这块对于新形式的变化反而更不上了呢?

这其中有很大的原因是,过去在传统运维、传统应用管理过程中,银行更多管理的是自己的后台数据中心内部的系统,看的是服务器、网络、存储等,保障每一个服务器、网络、存储的可用性都是4个9或5个9;但从用户而言的话,并没有看到用户的体验,没有看到应用的真实服务价值,所以在对后台的保障很完美的时候照样会存在困难。所以发现一个问题,从过去传统银行已有的监控工具来看,只能发现大概30%的问题,剩下的很多问题发现不到。

四、传统管理工具的能力是有限的 听云APM:新经济环境下的精益化应用管理-这就需要一些手段能够把没有覆盖到的,比如说对于交易的管理、应用的管理、用户体验的管理。那在这些都覆盖到之后就能看得到用户在真正使用银行的业务的时候,从登陆开始,到查询、转账、支付整个一个过程,如果发现过程中有一个环节出现了问题,比如说支付过程中支付不了,那首先这个问题是由什么引起的,如果能快速定位这个问题,从而进行快速的修复。这样就能对应用做到真正的精益化管理。

听云在国内精益化管理领域做了11年,在为客户服务的过程中,听云也在不断地沟通、不断地学习,我们发现在真正做管理层的,不是简单的说这是一个运维的事情、或这是一个开发的事情,因为这是整个IT部门的事情,它会涉及到我们多个部门之间的合作和联动,所以现在需要“三个中心联动”的方式来做这种精益化的管理。

四、建设“三个中心联动”的精益化应用管理听云APM:新经济环境下的精益化应用管理-1、决策管理中心

需要它对现实中的所有应用来做一个考核,这个考核一般情况下国有银行做得比较多的是两类考核。一类考核叫对标,或者是竞品分析,可以看到我们所提供的这个业务和其他的对标公司在服务质量、可用性、关联性是不是满足要求的;另一类是对于自身的对标,比如说今年做了十个业务,那么每个业务的质量到底如何。过去的时候会是通过好、坏、快、慢来进行评估,现在会对它做一个确实的考评。按照国内标准做法来说的话,就是会从整个对用户的体验、服务质量等等之中来选择几个指标来作为KPI考核的指标,来看这些应用内哪些应用是9分以上,哪些是6分以下,那么可以根据业务规划来淘汰不好的应用,从而为我们整个决策来提供更科学的规划支持。

2、开发策略中心

它做的更多的是从用户角度来保障应用的质量。过去的话银行对质量的要求是比较高的,可以看到国内最早做压力测试等都是从银行开始做起的,但是更多的时候还是在基于银行内部网络、内部环境来做,很难看到真实用户在使用过程中出现的问题。比如说现在开发业务开发好了,内测结果也不错,但是生产环境是很复杂的,有不同地区的用户,有通过不同运营商网络通道来访问的用户,终端的种类也比较多。那么怎么能保证每一位客户都能满足需要呢,这就是需要考虑的东西。但是银行又没有手段去查看真实用户在使用应用过程中所出现的问题。现在一般来说,在开发测试过程中,会增加一部分对于应用质量的评估,这种评估是基于真实的用户网络、真实的用户行为来看当前应用的状态是否正常,只有它满足要求的时候才会满足这个应用上线,从而保证应用的服务质量。

3、运维中心

就是在传统运维的基础上,提升对交互、用户、对应用的一个性能管理,比如说CDN的管理。CDN国内厂商比较多,质量普遍来说不是特别好。这就需要去判断在应用使用过程中出现的问题是不是由CDN引起的,这样在发现的时候才能要求CDN厂商去做优化,提升服务质量。另一块就是我们所需要做的相关监测,查看系统到底是否可用,针对不同地区、不同用户、国内国外等等在使用业务的过程中是否能够提供很好的服务,如果出现异常的时候,能不能对这个异常进行深入的分析,或者问题定位。这种定位强调的不是对于某一个服务器的定位,而是强调对于应用代码的定位。尤其在精益化建设过程中更为重要,比如说后台的某一个SQL语句,前台的崩溃代码在哪个位置,通过这些数据来帮助去做相关的优化,来提升服务能力。
所以通过三个中心的联动,能够保证系统满足开发、运维、管理这三个层面的要求,从而整体提升对于应用的管理和控制能力。

在金融行业,精益化管理已经比较成熟了,同时也在不断地丰富管理的思路和框架,现在大家看到的就是一个标准的管理框架,这个框架会通过外部应用、内部应用等不同应用的逻辑采集,通过相应的数据整理来提供一些相应的管理方式,例如集中告警、内容呈现,为开发、运维、管理人员提供相应的管理接口和界面。

五、金融行业精益化应用管理功能听云APM:新经济环境下的精益化应用管理-在未来,应该如何使用这套系统?或者这套系统能够带来什么价值?

1、要做关键性的转变。过去金融更多关注的是内部架构层面的一些东西,现在更强调的是看用户在使用过程的好坏,所以会通过一些关键视图来展示一些用户层面的信息,比如会有一个基于全国的地图,会看到这些用户在不同地区在使用主流业务的时候的业务体验是否有异常。有异常的时候会对这个业务进行一个实时打分。传统做法是通过事件关联的方式来关联到一张业务拓扑图上去,业务拓扑图会展示每个业务现在的逻辑关系,可以很清楚的看到是哪一个业务交易出了问题,这个业务交易是由哪个人负责的,开发小组就可以很方便的看到后台执行的怎样的代码,这条代码是由哪条SQL引起的,这样就可以在做优化的过程中有很清晰的方向。通过这种运维方式的好处就是,可以让不同层面的管理人员在同一个平台进行很友好的沟通,避免了过去跨部门沟通中的困难。

2、可以帮助我们真正的看到应用代码在逻辑中存在的问题,这是在过去运维中很难看到的,它减轻了逻辑上的错误和运维过程中的压力。
六、传统金融精益化管理的效果

1、真正看到用户的体验、行为。可以看到用户对业务的评价是如何的,是否能够真的达到最初设定的目标,是否能够满足整个企业发展的要求。

2、通过不断地对用户体验数据的收集去建立大数据,就像银行现在都在做各自的大数据。在业务数据中应该有很重要的一块是针对业务、应用性能的数据,可以看到大客户在使用不同业务时能否提供更好的服务给他,如果他的使用体验不好,那么体验问题是在什么位置引起的,应该要怎样做改进。这样会对大数据的建设来进行一个数据支撑。

3、用户故障定位。某一个重要客户的体验出现问题,能够做到快速定位并进行分析,将过去2-3天做的事情在1-2分钟内定位出来。

4、实时改进。一款应用不可能什么问题都没有,总会在某一方面出现问题。对于我们而言能够实时改进,能够把它改到一个用户能够接受的范围之内就可以了。

七、实现应用服务的可视化管理

所以在这种优化过程中,听云会提供一种可视化的管理效果,比如下图的管理界面。听云APM:新经济环境下的精益化应用管理-它把我们整个用户的使用情况、整个用户体验状态、关键业务交易的性能情况来做分开的展示。

在整个银行业精益化管理场景主要有这四大场景:听云APM:新经济环境下的精益化应用管理-1、应用性能管理听云APM:新经济环境下的精益化应用管理-标准是运维层面用到的东西,以某金融集团为例,基本上所有应用业务都已经使用了听云的服务,监控目的是希望能看到每一个业务交易的状态,每一个业务交易都会涉及到金钱的流失,随着业务的增长,会有怎样的问题来造成用户的流失和业务的变化。该集团在使用了听云后,最典型的变化就是改善了整体的崩溃率和投诉率,分别降低了50%和70%。

2、竞品分析听云APM:新经济环境下的精益化应用管理-对产品的规划、开发是有很大的帮助。以某银行为例,他们对于行业对标很重视,需要对它的每一个业务是否能够达到最初设计时的要求进行评定。为什么要做这么多的业务,一方面是提供这种的服务,一方面是提升企业的竞争力。企业的竞争力不是自己说了算的,是需要和同行的各方面性能、质量进行比较的,确认是否能够具有竞争力。

3、测试验收听云APM:新经济环境下的精益化应用管理-过去银行业务上线的压力比较大,每年的开发周期很紧张,大家都在不断地扑新项目,在这样的情况下就几乎没有什么时间来做测试,这样最后的结果就是让客户去做测试了。对此,某个金融公司的场景比较典型。过去的很多问题它在测试的时候都能发现,但是并不能确定这样的问题对应用能带来多大的影响,之后发现用户的反馈很严重。通过听云的服务就可以做到在产品上线前就监测到,会通过全国的系统来进行实时访问,看到整体的用户体验是否在可接受范围之内。通过这种方式,一方面加快了产品的上线时间, 另一方面,又提升了服务的质量。

4、数据驱动听云APM:新经济环境下的精益化应用管理-如何驱动业务价值的最大化?便需要对CDN、云服务等进行监测是否正常。某银行在做业务的过程中有很重要的一块,就是对CDN业务进行优化和评估,通过对业务的提升,来提升服务质量。

因为听云是国内的公司,所以提供的是本地化服务。我们一直强调我们是做服务的公司,不是做产品的公司。为什么讲这点呢,因为从APM行业中,听云更多监控的对象是用户,是应用。用户和应用意味着一定要有相应的配套服务,配套人员、配套知识来支撑的。从我过去对于银行的了解,大多数银行对于APM这方面是缺失的,听云可以帮助银行来做这方面的弥补和相应的拓展。

从听云的产品来说,主要做以下两种事情:

1、实时了解全球用户的金融体验:

做全球的用户体验监测,实际上在全球128个城市、国内470个城市,听云共拥有30W+的节点,这些节点会实时的跑任务,去查看银行当前的系统的用户体验。根据不同地区,不同运营商,不同的通道,帮助我们做一个用户评估。听云APM:新经济环境下的精益化应用管理-2、用户行为+性能数据,让业务价值数据最大化:

听云会看两类信息,一方面是用户行为和性能数据:可以方便银行看到用户使用银行业务哪方面用的最多,那这个业务就一定是用户体验保障的最好的,通过这种方式能真正提升自己的服务质量。另一方面就是后台的服务诊断,真正钻到应用层面时就会涉及到代码,帮助运维人员通过可视化的方法把应用层面的问题诊断并展示出来。通过智能化的分析,自动诊断后台某条代码出现问题,比如说某个API接口、第三方的调用等等;当有问题的时候,听云可以做切片化分析,分析出问题点是在用户端还是在服务器端,通过这种分析报警定位问题出在哪些代码上。听云APM:新经济环境下的精益化应用管理-听云会有大量的技术人员来提供相应的技术服务。大量技术人员配备的目的是在每个项目中都会有一个技术支持来进行跟进以提升服务质量,因为这部分对于大多数厂商都是知识缺失的一部分。