数据中心升至“云时代“ 虚拟化IT运维

如果要揣摩CIO对于新技术的忧虑,大多是因为这些新技术存在着失控的风险,但这也确实虚弱了他们在IT创新领域的魄力。这一点没有任何错误,对数据中心不进行任何修改肯定是一件很有把握的事情。然而,随着虚拟化、云计算技术的逐步成熟,传统数据中心升级换代至“云数据中心”已是大势所趋。那么,在虚拟化诱人的高额回报面前,相对滞后的IT运维管理是否能够防止虚拟化管理的失控呢?  虚拟化ROI“诱人” 运维却越来越累

2012年,IDC的一份调查报告指出,从服务器虚拟化整合节省下的资金将再用于四个主要IT“支柱”的投资:云、移动化、数据分析和社交业务。另根据调查,67%的CIO不再把自己看作是首席信息官,而是“首席创新官。”

并不是过度自信,随着数据中心物理硬件和业务软件现在已经准备就绪,数据中心的服务器虚拟化正在加速增长。而无论你是采用市场领先的VMware、Citrix公司的XenSource、微软的Hyper-V,还是开源的虚拟化平台,任何一款产品都能够提供一份赏心悦目的投资回报率(ROI)报告。在CIO拥有更多的富余资金,可以投入到创新领域中,虚拟化必将成为数据中心永久的成分。然而,很多虚拟化的先行者已经发现,数据中心接下来必然会遇到虚拟机“泛滥”的难题,这为虚拟化层面的IT运维管理增加了意料之外的复杂性。

作为国内领先的IT运维管理专家,北塔软件认为:“在传统数据中心,管理员对于基础设施管理一般侧重对物理设备、物理网络、物理存储的管理,而虚拟化后不但扩大了管理范围,而且增加了管理的复杂度。IT运维部门需要对新增的虚拟网络、数据存储、虚拟机、宿主机、集群对象提高一种全新的管理方式,如果运维的力度不能跟上虚拟机增长的速度,那么,不但不能对IT资源进行重新优化,还会把原本不错的服务评价拉回到起点。”

记者对一些已经大面积实施虚拟化的数据中心进行了走访,很多IT运维人员“越来越累”的现象恰恰印证了北塔软件的观点。很多IT运维工程师表示,服务器整合常常会给人一种假象,以为你减少了工作量,因为需要管理的物理服务器的数量确实少了。但是,事实是你增加了服务器的数量。这是因为你仍需要同样数量的服务器运行同样多的业务程序,但是,这些服务器现在虚拟化了并且管理更复杂了。而新增的业务系统也不用再等繁琐的服务器采购程序,开着“问题车”,走在虚拟化大路上的事情常常发生。

虚拟化失控 IT运维出现“盲区”

随着更多的企业完成了自己的测试和质量保证计划,这些企业正在把虚拟化技术应用到生产中,但必须承认有一些需要特别谨慎的事情。虚拟机一旦出现故障,如果不能及时恢复,这个损失可能远远超过节省电源和空间的费用。

在传统数据中心,管理员可以确定地表述:我的数据库在服务器A上运行,这台服务器与交换机B 进行连接并使用存储阵列C。但动态数据中心采用虚拟化技术后,解耦了这种关系,支持以更具伸缩性为中心方式利用这些基础设施资源,应用可以位于服务器集群中的任何计算节点上,可以利用任何存储设备上的存储空间,可以使用虚拟网络,也可以进行转移以满足性能或运营需求。但这些优势,却在IT运维管理中造成 “看不见”、“说不清”的严重问题。

我们都知道,通过VMware vSphere的DPM等功能可以实现绿色节能等目标。比如:有两台ESX/ESXi主机,在夜间业务不繁忙,企业为节能考虑,把两台ESX/ESXi主机中虚拟机在某时刻迁移到其中一台ESX/ESXi主机,并自动关闭另一台ESX/ESXi主机。在对VMware管理上,对于以上场景,传统的IT运维管理软件无法动态更新迁移后虚拟机的信息,会造成管理上“盲区”。

另外,虚拟化技术出现在了存储系统架构中的各个层面:主机层、网络层和存储系统层。每一种方式都可以实现更加简单有效地卷管理、降低数据迁移的复杂度以及减少重新分配存储空间次数等功能。但是所有的这些虚拟化技术,在带来一些优点的同时也增加了存储系统的管理负担。

北塔BTIM物理拓扑 让虚拟化不再抽象管理

通过上述分析,我们发现,与传统的物理环境下的IT运维管理不同,虚拟环境具有“不可见”的特殊性,表现为:动态的数量增长、场所自由变更等等。而vCenter等虚拟化监控软件的能力又很有限,虽然能够映射出各个管理对象的逻辑关系,但这些工具更加侧重操作性管理,缺乏对虚拟化环境的综合、关联等分析,无法查看对象的健康特性、运行性能等综合信息。因此,必须从虚拟机和物理服务器两方面同时进行监控,只有从这两个方面掌握准确的运行状况,通过动态实时地分析,才能实现资源分配的最佳化。

为了消除用户在部署虚拟化时的顾虑,在全面提供了对主机、网络、机房等领域的管理解决方案之后,北塔软件在北塔BTIM (Betasoft Integrated Management,IT综合管理软件)中增加了针对VMware虚拟化管理和FC-SAN存储管理解决方案。作为IT运维领域中首款从“物理拓扑”视角呈现ESX/ESXi主机、虚拟机、数据存储、网络所构成拓扑的第三方监控软件,北塔BTIM 以颜色变化方式展现管理对象健康特性,帮助运维管理人员实时了解整个虚拟环境当前的运行状况,达到透明化、事前管理目的。

虚拟化模糊了物理和虚拟、网络和服务器以及数据和存储网络之间的区别,在IT运维管理中最大的难题是:看不见、说不清。而在BTIM中采用的物理网络拓扑,最关键的是解决了IT运维管理新增的“盲区”和“黑匣子”问题。为此,北塔BTIM针对VMware基础架构拓扑(资源区、呈现区)管理采用了不需要人为干预自动运维机制,提供周期性定时自动更新功能,消除了“盲区”管理的隐患。考虑到用户对vCenter使用习惯:在拓扑展现上,分成资源区、呈现区,资源区依然提供树形方式展现虚拟中心、文件夹、数据中心、集群、ESX/ESXi主机的结构。呈现区则是把VMware vSphere抽象的虚拟化环境展现出来,对于ESX/ESXi主机、虚拟机、数据存储、网络对象以及逻辑关系一目了然的展现在IT运维工程师的眼前。

在北塔BTIM首创的VMware物理拓扑中,虚拟交换机和虚拟机会以“实体连接”的形式存在,以传统的物理链路运维形式展现虚拟交换机与虚拟机线路的性能指标,如:流量、数据包数、广播包等等。通过物理拓扑为核心的管理中心,可实现对ESX/ESXi主机、虚拟机、数据存储、网络、线路的管理,查看ESX/ESXi主机、虚拟机、数据存储历史记录信息,也可查看ESX/ESXi主机、虚拟机、数据存储、网络的一体化和告警信息。此外,通过管理中心,还可以针对虚拟环境的亚健康状况用颜色变化的形式提醒运维人员关注虚拟机状态和性能。比如,以红色表示需要特别关注,可能会出现致命的风险;黄色表示需要进行关注,暂时没有致命风险;绿色表示正常。

虚拟化有章可循 数据中心持续优化

BTIM虚拟化管理解决方案与vCenter有着良好的优势互补关系,深入性、关联性、即时性方面都有了进一步的发展和完善。用户在虚拟化设计实施完成后,可以通过BTIM验证最初的设计合规性,如:数据存储分配是否合理,ESX/ESXi主机整合密度是否合理,业务区资源规划是否合理等,从而实现虚拟化数据中心的进一步优化。

我们看到,各行各业的虚拟化数据中心的建设正在提速,如果不考虑IT运维管理,一窝蜂似地去上马虚拟化产品,会导致CIO带领IT部门把那些虚拟化厂商的优秀解决方案硬生生地搬到混乱的基础架构上。而通过北塔BTIM等有章可循的虚拟化运维方案,可以减少这些障碍,让虚拟化、服务器整合以及云计算实现更广泛的企业目标——真正降低IT的复杂性。