通过远程控制管理分布式环境

分布式环境资源,如主机托管服务或公共云提供商,帮助管理员扩展他们现有的环境,以完成更多与业务相关的IT任务,但随着IT基础设施的增长,管理员必须选择合适的软件来管理和监控分散在多个位置的资源。

和本地数据中心环境一样,管理员必须不断巡逻基础设施,优化性能,预防出现故障,在管理远程数据中心时,必须考虑以下事项。

规划分布式环境部署

不管你是采用云还是物理托管服务,远程数据中心都需要仔细规划,例如,如果远程数据中心只托管一个测试环境,项目经理必须建立适当的团队帮助构建和驱动项目,活动目录(AD)认证,存储区域网络(SAN)分配和其它重要资源可能分散在不同的团队,如果没有合理的规划,环境搭建好后可能会面临管理失控的局面。

规划时如果排除特定团队成员,管理员可能不会察觉到效率底下,例如,很多时候仅仅因为认为该环境不是关键环境就撇开安全团队,高水平的准备必须到位,因为访问企业应用大都是通过WAN实现的,即使在一个低优先级环境中,所有必要的考虑和规划步骤是不能省的。

如果你计划使用数据中心提供的按使用付费服务,那你一定要多花点时间制定合适的服务水平协议(SLA),这是规划过程中的一个关键部分,了解正常运行时间需求,服务指标,以及超额部分如何付费,关键是要确保环境满足组织,而不是服务提供商的需要。

分布式环境WAN管理

每个组织的分布式数据中心规划考虑WAN连通性和它对环境的影响,因为每个组织的目标都是不同的,带宽需求将依赖于基础设施的需求,在与WAN提供商打交道时,管理员必须知道他们WAN SLA的限制和告诫,以保证最佳性能。

在和WAN提供商谈判之前,最重要的是要通过测试现有工作量和带宽需求知道分布式环境的需要,在确定两个位置之间的带宽时需考虑SQL集群、SAN-to-SAN复制和应用程序网络,虽然没有哪两个环境是完全一样的,但可以遵循一些最佳实践。

主数据中心:它是一个集合了主要基础设施组件的中央计算环境,数以千计,甚至数以万计的用户连接到这样的环境,需要非常高的带宽和非常低的延迟,这种环境下的WAN需要多协议标签交换(MPLS),光纤链路或运营商级以太网服务。

分布式分支数据中心:这种数据中心通常比较小,但规模仍然相当可观,这种环境通常用来托管重要的辅助系统,这种数据中心对带宽要求比较温和,只不过仍然要求较低的延迟,因此还是建议采用MPLS或运营商级以太网服务。

用于灾难恢复或测试的小型数据中心:这种小型分支数据中心通常用于测试和开发,或用于灾难恢复,它们对带宽要求较低,但仍然要求低延迟,推荐采用基于T1/DSL的MPLS,宽带无线选择或Internet VPN。

选择分布式环境管理工具

在好工具的帮助下,资源管理变得越来越简单,但我们应该好好调整工具,帮助管理员将问题阻止在变遭之前。

有两个方法进行远程数据中心资源管理:控制和服务驱动,采用控制模式时,组织负责管理环境,工程师使用管理工具观察远程数据中心基础设施的需要,进而采取行动,在这种情况下,管理员可以使用Hypervisor平台的原生工具。

例如,Citrix XenServer的XenCenter,它既适合本地数据中心的管理,也适合远程数据中心,与此类似,VMware vCenter也可以在它的控制台或vCenter Web客户端分析多个数据中心,管理员还可以使用第三方工具。

采用服务驱动模式时,组织将它的数据中心外包给第三方服务商,如Savvis/CenturyLink,Ubistor和Equinix,客户管理自己的资源,通常,在托管环境中,组织可以根据合同利用现有的资源监控工具,其它时候,管理员只租用服务器硬件,在这种情况下,一切来自Hypervisor的工作量是由客户自己管理的,根据合同和解决方案的不同,选择可能不同,在这种情况下,最重要的是监控现有工作量,因为服务提供商会限制RAM、CPU和WAN利用率,合适的工作量和VM管理可以有效地避免这些额外成本。

使用虚拟化工具管理分布式环境

我们已经考虑了规划远程环境和管理其资源的重要性,接下来我们来看看如何真正实现,现代数据中心设计越来越依赖于虚拟化,Hypervisor技术也发展得非常成熟了,原生Hypervisor工具现在也提供了很强大的功能管理整个虚拟环境。

我们假设某个企业有一个远程数据中心运行在XenServer 6.0平台上,这个数据中心用于测试和开发,管理员监控性能和资源利用率,有时管理员可能会看到如图1所示的一个报告。


图1 XenServer 6演示环境:性能监控显示CPU、内存和网络利用率,管理员可以自定义这些图形显示其它统计数据

图1显示的曲线时间间隔大约是30分钟,其中有一段时间物理主机的RAM利用率达到了最大,毫无疑问,这可能是一个严重的问题,但管理员配置了合适的警报,可以给每个主机或每个VM设置警报,取决于环境的需要,警报也应该监控存储、CPU和网络。

在接下来的例子中,这个公司可能使用VMware的vSphere 5管理它的远程数据中心,和XenServer一样,vSphere也有强大的工具来监控和控制分布式数据中心资源,为了让远程管理变得更简单,vSphere的Web客户端工具提供了更精细的控制,如图2所示。


图2 vCenter 5 Web客户端连接到一个远程数据中心,可以从Web客户端直接管理VM

管理员使用vCenter 5 Web客户端可以看到所有运行在池和数据中心中的VM,管理员可以从这里执行一系列管理任务,包括使用实时迁移进行VM维护,如图3所示,vSphere Web客户端集成的工具允许管理员执行控制台提供的所有功能。


图3 vCenter 5 Web客户端可以管理整个虚拟环境,管理员可以在资源池之间迁移VM以最大化利用环境资源

正如你从图4中看到的,vCenter 5中的警报非常详细,可以快速通知到管理员,这些警报可以帮助他们快速响应问题,将问题消灭在萌芽状态。


图4 VMware vSphere 5 vCenter警报管理平台可以设置不同类型的警报帮助管理员监控特定事件

将企业监控软件扩展到分布式环境

另一个远程数据中心管理选择是利用企业现有的监控软件,其实很多监控软件可以通过配置实现跨数据中心监控的。

其中最典型的一个工具就是up.time 5,它采用了单窗口视图风格设计,使所有管理工具有机地组成一体,展现了整个基础设施的全貌,管理员可以下钻查看任一组件,确保环境保持健康状态,图5展示了up.time 5 24小时全局扫描的例子。


图5 up.time 5详细检查远程数据中心,显示资源的使用情况,这个图显示了一个远程数据中心和它当前的资源利用率,以及过去24小时的统计数据

Up.time 5工具集也允许管理员监控多个数据中心,如图6所示。


图6 借助up.time 5企业版监控软件,管理员可以从一个窗口看到所有远程数据中心的服务状态

第三方工具可以扩展分布式环境的能力,高度分散的数据中心环境需要这种细粒度的可视化,因为每个环境都是独一无二的,IT管理人员必须为他们的分布式数据中心基础设施确定一种最佳的管理方法,在决定选择哪个工具时必须以环境的目标为基础,例如,假设某个组织必须管理他们的WAN QoS,有Hypervisor GUI可能还不够,在这种情况下,需要寻找其它工具,创建清晰的WAN基础设施视图,通常流量可视化是急迫的需求,选择的工具必须要满足这类需求。

洞察是成功管理远程数据中心的关键

不管是哪种分布式基础设施,管理员必须要牢牢控制数据中心的资源,随着环境的变化,IT管理人员需要不断学习和寻找能保持组织效率的工具,能提前洞察一切是成功的关键。