应对四大挑战 实现云环境下的主动运维

作者:

BMC软件公司Service Assurance副总裁和总经理Ajay Singh

BMC软件公司Product Marketing for Proactive Operations高级经理Leslie Minnix-Wolfe

管理云操作类似于运行一个大型航空公司。在这两种情况下,用于提供服务的资源都相对固定,为了尽可能有效地管理资产,并以最低的成本提供最佳服务,需要灵活和主动式管理。所以正确的管理流程、资产和技术的重要性日渐凸显。

航空服务管理是复杂的,并且是高度动态的,数千名乘客和行李在数以千计的飞机中转移,在保持对所有细节监控的同时确保客户获得最佳体验对于管理是一个挑战。同样,云的运营环境是复杂和不断变化的。数以千计的工作量在实体服务器之间传输,对各项数据细节进行持续监测并确保最佳的终端用户体验也很难。

一、主动式云操作和业务服务管理(BSM)

要积极主动地管理云环境,需要解决四大难题。

1、了解环境:收集、整合、分析和更新来自内外部的各种不同数据来源

2、掌控高度动态的环境

3、应对“多米诺骨牌效应”——运营环境中的一个变化或问题可能会影响到数百个服务

4、将服务请求管理自动化,使您可以对至少数百位用户的服务请求进行快速的响应

业务服务管理(BSM)解决方案可以帮助您解决以上四个方面的挑战。 BSM是一个综合性的方法和统一的平台来帮助IT机构削减成本,降低风险,并提高业务利润。 BSM解决方案提供了多种自动化,管理和分析服务,使您能够主动地管理云环境。

本文以下的四个战略,可有助于您在云环境中实现主动运维:

一、了解环境:收集、整理、分析数据

如果您想有效地管理日新月异的混合数据中心,那么必须先了解您现有的实体的,虚拟的和云的环境,以及它们如何组合在一起来提供商业服务。因为管理虚拟和云环境的复杂性在不断增加,所以获得实时数据会是一个挑战。您可以利用很多不同的内部来源 ——内部服务器、主机、网络设备、应用、存储设备来收集详细的数据。

挑战来自于如何通过巩固、规范和分析数据得到一个整体的IT服务状态的概览,BSM解决方案可以帮助您满足这些要求。首先,BSM的自动探索和依赖映射解决方案,从不同来源收集数据,协调、规范并合并成一个可以供不同的服务管理工具共享的单一并统一的数据资源库(即配置管理数据库CMDB)。与此同时,BSM系统管理解决方案实时监控系统性能和不同资源的情况,可以与实时服务框架以及CMDB同步,以确保服务框架不变的情况下仍然可以作出准确和及时的IT决策。该解决方案跨多种不同的平台,供应商和数据来源,并规范、巩固和分析性能数据以确定系统性能问题的根源。

二、保持对动态环境的控制

虚拟化为云计算提供了基础,也大大增加了数据中心的动态性。在虚拟和云的环境中,包括服务器、网络、应用和存储在内的资源都是虚拟化的。随着工作量和业务需求的变化,这些虚拟化的资源正在被不断配置和重新配置。因此,你要面对不断变化并拥有大容量资源的环境:

1、探索

自动探索和依赖映射解决方案可以帮助您通过不断扫描环境,持续维护当前的应用程序和基础设施数据并相应更新服务模式。此外,一些绩效管理解决方案能够通过实时监测环境的变化,通知CMDB数据库来调和这些变化,确保服务模式的实时准确性。

2、变更和配置管理

影响动态数据中心的另一个要素是变更和配置管理。无论变化多么迅速,您都需要确保所有的变化是遵守内部政策和外部法规。您还需要确保变更管理流程不妨碍敏感的虚拟和云环境。在这里,BSM变更和配置管理解决方案可以助您解决该问题,BSM将一个包括变更审批、调度、执行、验证和跟踪的闭环过程实现自动化。

3、操作

动态的云环境使操作也变得复杂。虚拟和云环境的根本就是一个高容量的变化体,这就要求您迅速适应不断变化的容量需求。因此,您还需要了解和跟踪容量变化的正常节奏,以及通过行为学习以支持未来的变化走向。只有这样,您才能区分正常和非正常的波动,并消除虚假的警报。

BSM的系统管理解决方案集成了性能和配置管理解决方案,因此,就更容易确定近期配置的变化是否会造成性能问题。他们还可以自动学习和跟踪虚拟和云环境的变化。如果没有这项技术,那么在动态的虚拟和云环境中,当变化对服务水平产生影响的时候,依靠手动的分析是无法确认的。

三、有效应对“多米诺骨牌效应”

虚拟化和云计算的主要目标是最大限度地提高资源利用率??,同时确保最佳的性能。这意味在同一个共享的资源上放置多项服务。然而,共享资源越多,发生问题时的影响越大。而且由于很多服务是共享的,一种服务的出现可能是与其他服务结合的结果。所以,任何一个服务产生问题都会对其他服务造成“多米诺骨牌效应”,这个骨牌效应特别会对公共云产生影响,因为公共云有广泛的客户基础,而且会扩大商业影响。

BSM系统管理解决方案可以主动监测物理、虚拟和云资源,并为潜在问题提供预警,然后自动评估并面向业务优先解决关键问题,自动生成故障单,并附加根源和影响信息,加快生成问题的优先顺序和诊断。

您还需要注意容量管理,从而做到在保持服务质量的前提下实现资源的高利用率??。 BSM解决方案可以对业务、应用、基础设施和工作量的数据进行分析,以确保为业务服务提供更准确的容量。BSM解决方案还可以执行“假设”分析来帮助您确定和规划未来的容量需求。有了这些解决方案,无论现在还是未来,您都可以在不超支和增加运营资源的情况下规划和安排您实际真正需要的容量。

四、自动化服务请求管理

云环境中的主要功能之一是用户可以要求服务,通常是通过自助服务门户。他们可以从中选择各种不同类型的服务。一类是基础设施服务(IaaS),云为其用户提供了一个标准的操作系统映像。另一个是平台服务(PaaS),为软件工程师提供一个像NET或者Java™那样的开发平台。第三类是软件服务(SaaS),提供一个特定的业务应用程序,如销售渠道管理。

BSM解决方案可以判断用户的权限级别,配置和提供相应要求的服务。他们还从请求开始到请求执行来进行跟踪,并允许用户监视其请求的状态。此外,该解决方案自动地部署和配置服务所需的系统管理工具,保持了相应的服务水平。最后,您还可以利用BSM解决方案得到详细的报告或内部自助门户网站关键绩效指标的图形显示。