APM在国内企业级服务市场无疑是一颗耀眼的新星,随着云计算和移动互联网迅猛发展,传统的B/S架构已经全面转向APP+云端架构。无论是终端,APP,网络,代码,物理硬件都面临巨大的挑战,而任何一个环节的性能瓶颈都会造成对用户体验的影响,因此新的应用性能管理亟需真正的端到端一体化监控。
应用世界 性能瓶颈成为运维难题
现在很多企业把系统分解成更小的业务单元,期盼细粒度的系统分解能带来诸多的好处。但随之而来的是生产环境下的监控越来越复杂,很多应用需要多个服务协作,同时这些服务又运行在多台物理或虚拟机上。
如何在多台主机上找到问题根源?如何从多个应用之间的互联中发现应用的性能问题呢?庞大的主机数量和更多的虚拟机数量给运维带来了巨大的挑战,用SSH获取日志已经力不从心,日志管理者面临前所未有的考验,如何能帮助企业快速发现问题、定位问题和解决问题,这就需要云智慧透视宝的帮忙。
透视宝是云智慧经过多年技术积累,推出的面向云端和移动互联网的应用性能管理解决方案,能打通从客户端到服务端的完整事务链路,实时发现业务系统的端到端性能瓶颈,将用户体验发挥到极致。
透视宝端到端应用拓扑详解
1、「全局端到端」,一体化自动发现应用与应用、资源的依赖关系及各应用互调的性能问题,为应用建立全过程快照,自动发现应用与组件调用的关系,各组件的当前性能状态,快速发现影响性能的应用和最慢的组件,挖掘性能消耗的热点。
由于大多数的系统都是通过多个服务不同的协作方式提供的接口实现的,所以级联故障是特别危险的。例如,音乐商店与商品目录服务间发生了网络连接故障,服务本身是健康的,但他们不能互相通讯,如果我们只监控单个应用本身,是发现不了问题的,如果部署了透视宝的全局监控,就可以第一时间发现整个应用与应用,资源之间的健康度,并及时定位和诊断应用的性能问题,所以我们需要以整体的方式来查看系统的情况。
云智慧透视宝的全部拓扑图级联关系是自动发现,并不需要埋点,减少开发人员手工操作的繁琐和可能的错误,应用的健康状态可以通过设置阈值来定义,不但反映了应用的健康程度,同时可以配置告警规则进行告警。
2、「应用端到端」,单一应用的拓扑图能够实现不同语言环境的互调,例如PHP应用调用JAVA应用以及第三方接口调用的情况和性能分析,并且可以通过单一事务进行trace的监控和分析。每一个原始请求可能会产生多个下游服务请求,比如注册,登录,支付,如果在支付环境出现错误或者缓慢。
通过单一应用拓扑图可以一目了然的掌握请求的上下游链路,具体分析应用的事务的健康程度,是正常,缓慢,非常慢,甚至停止,通过错误和异常判断应用是否健康,而且对各项指标进行定位和分析。
3、「单一事务端到端」这里的事务是云智慧针对应用性能管理提出的全新概念,事务摒弃了以往运维工具的技术视角,而是从业务的视角,按照用户行为路径去分析性能。
针对单一事务的追踪可以还原业务缓慢和故障的案发现场,请求的参数不同是造成特定事务缓慢的原因之一。堆栈分析可以发现方法执行响应时间占比等,并通过HTTP请求的参数,方法堆栈的追踪,慢SQL的追踪来定位和修复问题,进而对单一事务的下游服务性能进行诊断。
总结:在集中式的应用世界里,我们至少有一款应用性能管理工具——透视宝,可以帮企业发现应用、网站运行卡顿、缓慢,人为原因导致的编码效率低下,系统错误和异常所带来的不良使用体验,运营部门受到用户喋喋不休的抱怨和居高不下的用户流失率。
有了云智慧的透视宝,企业有望告别通过海量日志分析排除问题的低效率,解放开发和运维人员生产力,让定位故障变的简单。