由于"云"拥有传统IT不具有的独特优势(按需购买与按使用付费的商业模式、高度可扩展及灵活的服务方式)与价值(新的存取、新的能力、新的连接),因此正吸引着众多的企业期望建立属于自己企业拥有的"私有云"和/或使用"公共云"中云服务供应商提供的云服务。从"云计算"的体系结构角度看(如图1),云服务的最终用户将"云"看作为"公用化计算"或"服务公用化"。在云中,计算资源可以像人们使用水、电一样按使用量付费,大大节省IT建设的初始投资成本;计算资源可按应用的工作负荷变化灵活地供应和执行再分配,使具有极大的可扩展性和弹性。因而企业十分青睐这种新型的IT服务商业模式。但是对于云服务供应商来说则主要考虑如何组建云生态系统,如何保障云服务供应和如何管理云服务。
从上图可知,"云"不再仅是虚拟化与网格技术的实施、计算资源的集合与操作系统的供应,它还应包括建立管理这些资源的策略和措施。事实上,云的推广和使用并不一帆风顺,它存在的许多不确定性正限制了它的接受和发展,如成本与服务等级、数据安全与保护、可扩展性与可靠性、审计与法规遵从、控制与治理、安全性、性能、可用性等,其中最后三种不确定性最为突出。因此,为加速"云"的接受和对"云"可靠性的信任,必须从管理开始,通过确认、监督、诊断等手段解决以上不确定性。值得注意的是人们在被"云"的好处吸引之时,往往忽略管理的挑战。为深入了解云的管理和如何实施云管理,我们将从以下云服务的体系结构的各个组成部分着手,详细阐述主要的云管理内容和解决方案。
底层为云基础设施是云服务的基础部分,它由服务器、存储和网络等基础设施组成。它依靠先进的虚拟化技术形成各自的基础设施资源池供托管的各种云服务共享,并通过网格技术实现工作负载均衡分配以提高云服务的并行处理性能。因此与云基础设施有关的管理将主要涉及基础设施资源管理、虚拟化与容量管理以及基本生命周期管理。
基础设施资源管理 – 基础设施资源管理的核心是能发现、监督和控制云中的计算资源(包括物理的和虚拟的两种资源),建立安全的、高可用的、自动化的基于基础设施的服务供应管理,以满足计划内与计划外的资源变化需求和快速完成计算资源的按需供应服务。通常,它是采用平台管理工具(如HP SIM软件)来实施对托管的基础设施资源管理的,如HP SIM 是世界最流行的平台集成管理软件,它除了能管理服务器外还能管理存储设施、网络、客户机和打印机等资源,并能与其它基础管理软件集成提供集成的跟踪和远程在线支持。HP SIM在与HP Storage Essential 集成后,还能提供集成的异构网络管理功能(DAS、SAN、NAS)以及存储资源管理和应用基础设施管理。除HP SIM软件外,HP提供的HP Data Center Automation软件(包括服务器自动化、存储自动化、网络自动化等功能)具有极强的自动发现、监督、控制多厂商异构基础设施环境的能力,因此它也被企业和服务供应商广泛采用作为基础设施资源管理软件。
虚拟化与容量管理 – 云基础设施的环境(或者云计算环境)是一种借助虚拟化技术以实现按需动态供应、配置、重新配置资源及取消资源供应的环境。云中的基础设施以虚拟的共享资源池的方式存在,它包括物理机器、虚拟机器以及其它资源,如存储局域网络(SAN)、网络装置、防火墙等,可以按托管应用的需求进行供应与回收。云服务供应商利用先进的虚拟化管理软件(如HP Insight Dynamics-VSE)可以实现Web2.0应用程序和网格应用程序的托管(快速供应和部署物理机器或虚拟机器)与进行容量管理(增加工作负载),并利用工作负载管理器(如HP Global Workload Manager)实现实时监控SLA遵守和进行动态资源分配。HP Insight Dynamics-VSE是一款集成的虚拟化管理软件,它可帮助IT管理人员分析和优化托管的虚拟与物理资源,加速复杂的虚拟化技术项目实施和简化日常运营管理。HP Insight Dynamics-VSE软件中包含了业界最先进的实时容量规划工具,它允许通过收集来自虚拟与物理资源的每天/每台服务器的上千数据连续分析服务器的容量和用电,并针对不同的服务器的工作负载提供最佳的匹配建议(五星级分级系统)。HP Insight Dynamics-VSE利用了逻辑服务器的概念(Server Profile)提供虚拟与物理资源间快速转移工作负载的能力以均衡虚拟与物理资源的利用,并通过与HP Insight Orchestration软件的集成实现服务器资源的自动连续供应。此外,HP Insight Dynamics-VSE也提供了高可用性支持,保护系统和缩短维护时间。
基本生命周期管理 – 从部署到集成的生命周期管理使服务器的管理更简易、更有效、更经济。它包括托管可执行应用程序映象、进行硬件与操作系统配置、执行安全扫描与补丁应用管理等服务。利用HP Insight Control (ICE)管理套件可提供快速部署服务器,安全、自信地优化系统能耗,主动式管理系统健康与性能,以及不受地域限制的远程控制等功能。此外,它也可通过与HP Insight Virtual Machine Manager (VMM)软件的集成使虚拟机的管理功能进入HP SIM 和HP ICE的管理范围,使系统管理更方便简捷。
无论是IaaS、PaaS、SaaS服务供应商,为使他们提供的全球级云服务能可靠持续地供应、可确保质量与使客户满意,及最终从服务中获取利润和实现业务增长,他们必定致力于云服务开发和管理建设。对于云服务来说,图2中左方的云平台组成是针对开发和运行多-租户服务的程序设计环境。为了保证开发的云应用的质量,在投入使用之前云服务供应商必须要对应用的安全性、性能、可用性进行事先的监测(如SOA、功能、业务流程、工作负载、安全漏洞和可能的故障恢复等),因此他们会选择一些与开发应用相关的工具进行压力模拟与安全测试或抽点检查(Checkpoint)以保障高质量的云应用开发和克服投产后可能出现的不确定性。在开发云应用的过程中,服务设计师可以选择如HP Quality Center(质量中心)、HP Performance Center(性能中心)和HP Application Security Center(应用安全中心),等管理软件或其它工具作为云平台开发环境的核心保障管理软件。
云管理组成是云服务供应商的核心管理平台,涉及计量与收费、服务生命周期管理、云服务保障管理等内容。计量与收费比较简单,主要是云服务供应商要开发一个实时计费系统以便对用户进行按使用收费,如按实际使用的CPU小时数、存储容量和网络流量等计量。HP提供的HP Insight Orchestration 软件具有一定的计费功能,并可与第三方计费系统集成,它可将服务费用数据以自动激活工作流的方式传输给指定的计费与收费系统。
云管理组成中的云服务生命周期管理对于服务供应商来说尤为重要。如同传统数据中心中的应用开发过程一样,需要经历从应用设计与编成到应用封装与供应再到应用激活与扩展直到应用监督、然后循环往复的生命过程。而云服务生命周期则更为复杂,它需要经历服务的全生命周期过程,包括从服务策略开始,到服务总体结构、服务工程、服务转换、服务运行以及随后的持续服务改进的全部过程。
服务策略 – 是指启用、管理和治理云服务的规划。开发恰当的服务策略将确保与治理和法规遵从的要求一致,并能形成合适供需关系的服务供应链(标准化的服务组合与服务交付);服务策略规划将帮助云服务供应商通过监督和管理云中的服务性能和可用性,建立业务服务管理规范;实施财务管理以确保最佳的投资回报,使管理与交付的服务体现价值并符合业务目标。
服务总体结构与工程 – 涉及服务规划、服务设计、服务开发和服务测试等管理。
服务的规划、设计与开发是为多资源云环境中新的或变化的服务/功能确定可能性;服务测试管理则是根据预先确定的质量、性能与安全测试策略通过检验以确认开发的云应用是否适合和可用于专用云环境,及加速服务部署。
服务转换与运行 – 涉及服务变更、服务目录、服务运营和服务改进四方面的管理。
服务变更管理将确保新的或变化的服务在投产过程中能持续运行而没有不希望的服务中断;服务目录是代表在云中可提供的标准化的云服务和IT服务,它通过自助服务门户交付使用;服务运营管理可确保在多源云环境中能通过自动化的流程管理和监督软件有效地交付服务。
服务改进 – 将通过集成持续的业务需求变化的管理确保提供的服务质量能如始至终地获得提升。
作为云服务生命周期管理的管理软件,HP BTO软件解决方案将是服务供应商的最佳选择。因为它包含了从服务规划到应用开发再到运营管理的全套管理组件,其中,项目与组合管理中心(HP Project and Portfolio Management Center)、SOA中心(HP SOA Center)业务可用性中心(HP Business Availability Center)、运营中心(HP Operations Center)以及服务管理中心(HP Service Management Center)等软件的管理作用显得尤为重要。
云服务保障管理是云服务供应商使用户信任和使用云服务的保证。事实上,很多企业在是否接受云服务时正处于艰难的决择:信任与风险。因此,如何做好云服务保障管理就必然成为推动"云"发展的关键。从云的不确定性角度看,最突出的不确定性是云的安全性、性能、可用性,这也是用户最为关心的考虑。因此目前,云服务保障管理的内容也就是首先要解决对云安全性、云性能、云可用性的管理。此外,云服务保障管理还将包括云的备份和保护云中贮存的数据等管理。
云安全性是云服务用户的主要担忧,为了确保企业和客户数据免于非授权的存取而遭受破坏、业务流程免于黑客入侵而泄密、云应用免于病毒入侵而干扰,安全管理是必不可少的措施。云服务供应商将使用安全管理软件,通过扫描网络、操作系统、中间件层和Web应用确定与入侵、应用" hi-jacking" 、非授权数据访问等相关的漏洞。安全管理软件将提供精的安全-风险视图以确保用户数据安全。HP提供的HP Cloud Assure 解决方案组合(软件与服务)将为云服务供应商或企业"私有云"提供端到端的安全风险评估与通用安全策略,自动进行安全测试(扫描网络、操作系统、中间件和Web应用以探测和纠正安全漏洞),以及针对安全信息管理的集中权限控制与Web访问管理。
云性能是云服务用户的另一种考虑,作为云服务供应商当然需要了解自己提供的服务等级是否满足/遵守客户的需求,衡量是否有足够的基础设施容量和可扩展性可服务于他们的最终用户(包括新的和随后的业务增长需求),以及通过最终用户的体验是否足以使用户满意并能使他们成为忠诚的用户。HP Cloud Assure解决方案组合提供了企业级的应用性能测试以使提供的云应用能满足最终用户的带宽与连接需要和用户体验(如响应时间、错误发生率),以及确保云应用能扩展支持峰值负载的需求和协助验证服务等级协议(SLA)。云性能的优劣将直接影响最终用户的云体验感受。
云可用性是保障关键业务云服务在用户在需要使用时确实可用的关键。云服务供应商需要随时了解服务的正常运行时间和性能的可视化信息,以及进行针对业务分析的趋势分析以预测由应用性能引起的问题和防止故障发生。HP Cloud Assure解决方案组合提供了对云应用的无缝监督,帮助IT管理人员离析问题和确定与最终用户环境和业务流程联系的根原因。其方法是从最终用户开始,然后深入到应用组件、套装应用与后端各层次,通过测试与监督基于Web的应用、业务流程帮助管理人员分析性能问题和预测故障趋势,使实现可用性最大化。
云服务门户,用户可从那里获得云服务供应商提供的云服务,关于云服务门户的管理将主要包括通过服务目录的自动供应管理、SLA和合同与变更管理。综所周知,服务的自动供应是"云"的核心功能,云用户和云管理员是通过Web界面使用该功能。以下以图3所示的云服务供应链为例,说明服务目录与自动供应管理过程。在云服务门户中所提供的服务一般是由云服务供应商事先开发的一些标准服务模板组成,形成服务目录供授权用户通过目录按需选择适合的服务,然后该服务在经过管理员批准后方可获得使用。
在云服务设计过程中,云服务设计师将利用先进的设计工具(如HP Insight Orchestration软件)进行标准服务模板的可视化设计和服务工作流程设计,并将服务工作流程与服务模板连接,使得用户请求的服务能自动执行。
利用HP Insight Orchestration软件将减轻云服务设计师的负担,使得IT资源的请求能以系统化的方式处理,以及充分利用标准化配置、自动供应工具和自动审批流程帮助服务供应商加速供应计算资源的处理过程,使基础设施资源实现自动化供应。
保证云服务供应的另一种重要管理是基于SLA的合同管理和合同变更管理。SLA通常是经谈判后,服务供应方对服务请求方的承诺,是双方同意的协议。通常,它包括与服务相关的优先权、责任、保证和费用等内容,如可以规定可用性、性能和运行方面的等级,或者服务如何收费与违反SLA的惩罚条款以及是否遵守PCI法律规定(证明服务供应商的系统是被安全管理的)。在云中,对服务的预订和调度将以合同为准,通过合同,云管理员可以根据合同规定的开始和结束时间准确为服务调度资源。在合同开始时获得所分配的资源,在合同结束时所分配的资源将被收回。当然,为配合用户的需求变化还需要有合同变更管理,如用户要求延长合同结束日期、增加新的资源需求等。必须注意的是所有合同的合法性或合同变更都将以流程方式(BPEL流程)经过授权经理 的批准后方可执行。从合同管理的流程看,它与传统的IT服务托管/外包合同管理是一样的,所不同的仅是商业模式,云服务是按实际使用的资源量计量收费,而不是按服务等级和固定时间收费。
至此,我们已经详细地描述了云服务体系结构中的主要管理内容与解决方案。管理的目标是提高服务质量、降低业务风险、保障云服务供应。如果云服务供应商不能确保他们云服务的安全性、性能和可用性的话,则将会使云用户的商业业务处于危险的境地;或者云服务用户如果不愿用他们的商业业务冒险的话,则"云"的不确定性将成为广泛推广云服务的严重障碍。相反,不管是云服务用户还是云服务供应商如能管理好这些风险,则将能使"云"的商业模式获得巨大的成功。