1 引言
随着网络维护管理模式由分散式粗放型向集中式精细化管理模式迈进,铁通公司提出了“强化支撑能力,加强网络集中化管理,在集中化维护管理的基础上,逐步实现核心机房的联合值守和非核心机房的无人值守”的目标。
如何在有限的资金投资的前提下实现网管集中的目标,同时满足降低网络维护成本,达到维护出效率,节能减排的指标要求,是我们在网管集中工作中重点关注和努力的方向。由于铁通陕西分公司部分网管未搭建统一的集中化平台,制约了网管集中及维护管理模式集中化推进工作的整体实施,通过搭建虚拟化平台,实现了网管集中化维护管理的要求。
2 现有网管集中技术的缺陷及弊端
2.1技术落后、效率低下
既有网管接入方式主要采取将放置在机柜中的几十台工作站终端逐个接人KVM,通过KVM终端盒接入显示器,通过显示器进行切换分别进入不同的工作站终端进行维护操作。
从以下流程中可以看到。运维人员在处理一个区域的告警信息时无法看到其他区域的告警信息,只有在处理完这个区域的告警信息后才能处理下一个区域的信息,那么排在后面检查的区域告警往往得不到及时的处理,且随着业务系统的增加,维护人员需要管理的系统越来越多,这种轮询检查的方式将越来越成为制约维护效率提升的瓶颈。
2.2网管终端设备数量多维护成本居高不下。
几十台网管终端占据机房机柜资源,大量的终端清扫、部件维护和更换等在增加维护人员工作量的同时也增加了维护成本。同时新增系统时需增加网管终端及机柜,受机房条件制约性很大。不算人工工作量,仅终端维修费支出每年平均在6.8万元。
2.3带来耗电量及运营成本的增加
从维护成本支出上计算,每台工作站终端按250W 能耗计算,在不考虑空调等耗电量的情况下,每年需要消耗近20万度电。
2.4系统架构分散使得管理难度、网管系统安全隐患增大。
由于系统架构分散,无备用终端,一旦故障,不能得到及时修复,对网络正常运行形成潜在威胁。
3 虚拟机技术介绍
计算机虚拟技术是指计算元件在虚拟的基础上而不是真实的基础上运行。虚拟化技术可以扩大硬件的容量,简化软件的重新配置过程。允许用户在一台服务器上同时运行多个操作系统,并且应用程序都可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。虚拟化能在虚拟机技术(Virtual Machine Monitor)中,不再对底层的硬件资源进行划分,而是部署一个统一的Host系统。
在Host系统上,加装了Virtual Machine Monitor,虚拟层作为应用级别的软件而存在,不涉及操作系统内核。虚拟层会给每个虚拟机模拟一套独立的硬件设备。包含CPU、内存、主板、显卡、网卡等硬件资源,在其上安装所谓的Guest操作系统。最终用户的应用程序,运行在Guest操作系统中。
虚拟可支持实现物理资源和资源池的动态共享,提高资源利用率,特别是针对那些平均需求远低于需要为其提供专用资源的不同负载。这种虚拟机运行的方式主要有以下优势。
3.1减少终端设备数量
遏制此类设备的增长。降低维护管理成本使用虚拟化技术可以有效减少管理的物理资源的数量如服务器、工作站等设备的数量,遏制此类设备的增长,隐藏物理资源的部分复杂性,通过实现自动化、获得更好的信息和实现中央管理来简化公共管理任务;实现负载管理自动化,可以支持在多个平台上使用公共的工具,提高工作人员的效率。
通过虚拟化技术将多个网管系统整合到一台主机上,可以依旧保证一套系统一台服务器。从而在不影响网管业务的使用的基础上,有效减少硬件设备的数量,降低电力资源的能耗。减少设备所需机架位置空问,避免因设备数量增长造成的机房环境改造
3.2简化配置过程,提高使用灵活性
通过虚拟可实现动态的资源部署和重配置,满足不断变化的业务需求。使用虚拟化技术还可用于简化和加速安装配置过程,而且增加工作站所需计算资源也可以与硬件的购置进行有效的分离。
如果特定的业务流程需要更多处理能力,添加所需处理能力的过程可以更加简化。除了虚拟化的环境。计算能力需求也完全可以实现自助方式,实现形成更动态的资源分配。
3.3提高安全性
虚拟可实现较简单的共享机制无法实现的隔离和划分,这些特性可实现对数据和服务进行可控和安全的访问。通过划分主机及内部虚拟机,可以防止一个应用程序影响其他程序的性能,或导致系统崩溃。就算原有应用系统不稳定也可以运行在安全、被隔离的环境中。
如果日后进行全面的虚拟化策略,可以使系统管理员进行可用的容错规划,在发生意外时保证业务连续性。通过将操作系统和应用程序实例转换为数据文件,可以帮助实现自动化和流线化的备份、复制及供应更稳健的业务连续性,并加快故障或自然灾难后的恢复速度。再进一步发展虚拟化集群技术可以实现业务不问断功能,实现多机热备。
3.4更高的可用性
将整个计算基础架构进行虚拟化,再通过专门的软件对网管系统、虚拟主机进行集中化管理,可在不影响用户的情况下对物理资源进行删除。减少管理资源与管理流程,进而减少网管系统硬件架构的复杂性。
通过集中的、基于策略的管理,无论是对虚拟机还是物理机的资源,都可以运用端到端虚拟化技术的优势,让维护人员从中央位置处理企业级的安装配置和变动管理,从而大幅度减少管理系统硬件所需的资源和时间。
3.5更高的可扩展性
通过调整虚拟机内部资源配置。可以实现更大的虚拟资源支持,意味着在不改变物理资源配置的情况下进行规模调整。同时对系统进行升级配置,可以实现更大的虚拟资源扩展。
3.6互操作性和投资保护
虚拟资源可提供底层物理资源无法提供的与各种接口和协议的兼容性。
3.7改进资源供应
与个体物理资源单位相比,虚拟能够以更小的单位进行资源分配。与物理资源相比,虚拟资源因其不存在硬件和操作系统方面的问题而能够在出现崩溃后更快地恢复。
4 虚拟机技术在网管集中工作中的应用
4.1虚拟机技术在网管集中工作中的实施
(1)选择虚拟化系统架构
正确选择最佳的虚拟化基础架构解决方案来满足网管集中的需求,保持升级及未来扩展的延续性,是减少重复性部署。从而保持优势的关键。综合微软Hyper—V、VMware(ESX和vSphere)以及Xen嗯杰支持的开源虚拟机管理程序)优缺点,我们选择VMware vSphere 5软件作为虚拟机平台的底层系统。
(2)进行网管系统运用现状调查
目前网管系统工作站对硬件系统要求比较低,CPU频率一般1GHz,内存512M,操作系统多为Win2k或winxp,网络需求主要是向服务器数据库读写数据流量,无大规模硬盘读写,对系统资源占用不大,这满足虚拟化技术整合的一个必须条件,虚拟化整合的效果也最好。一台CPU为8核2.25GHz、内存为48G的服务器就可以承载超过20台网管虚拟机终端。
(3)对虚拟平台进行规划
规划阶段需要完成虚拟化项目的整体规划:服务器数量的规划,存储规划,每个虚拟机划分多少硬盘空间,虚拟机文件存放目录、硬盘挂载情况;
调查服务器IP地址,规划虚拟机VLAN进行网络规划:规划服务器网卡数量、规划网络冗余线路、规划虚拟化网络策略:安全规划,从网络、系统、文件、域等方面对用户和权限进行划分,把监控网段和虚拟机内部业务网段隔离分开,并通过ACL访问列表控制,保证信息安全。以西安本地为例,有工作站物理终端38台,共16段IP地址,其中有9台设备IP地址通过修改服务器IP地址,使其处于同一个网段范围,8台服务器地址属于同一网段,另外有8台设备服务器地址完成相同,其余6台服务器IP地址不在同一个网段,对IP地址相同的划分VLAN进行隔离。
(4)设备安装调测
安装硬件服务器主机,布放网线、电源线,安装虚拟机底层系统,安装虚拟机各组件,配置交换机、配置vlan、配置安全策略。创建存储空间,防火墙设置。在西安部署两台虚拟机及一台24口网络交换机,服务器主机采用8核CPU,24G内存条,在交换机上划分两个VLAN,两台虚拟机分别连接至两个VLAN实现逻辑隔离,从各交换网管终端所在交换机连线至虚拟机交换机,同一网段只引一条上行网线,不同网段各引一条网线至虚拟机交换机,在两台虚拟机服务器上安装VMware vSphere程序,同时在西安通信楼五楼网管监控机房新增4台计算机物理监控终端,监控终端通过网线与虚拟机交换机物理连接,终端安装WINXP操作系统及Vmware vsphere Client程序,分配虚拟机客户端计算机IP地址,通过虚拟机客户端程序登录连接虚拟服务器。
(5)进行工作站虚拟终端平台安装及调测
根据工作站虚拟终端需求及模板,克隆工作站虚拟终端数量,由于克隆后的设备名称与IP地址完成相同,为了避免加电后出现冲突,因此,克隆后,先打开一个虚拟终端电源,根据终端使用的用途及终端IP地址规划,更改终端计算机名称及IP地址后,进行虚拟工作站终端与服务器连通眭PING测试
(6)系统运行及性能进行监测
对虚拟机性能进行监控,确定有无死机、进程无响应等问题,查看虚拟机的稳定性,根据运行情况对个别虚拟工作站资源配置进行优化调整。
4.2虚拟机技术在网管集中工作中取得的效果
(1)改变了网管系统架构,减少了中间架构,简化连接关系。通过网管终端虚拟化。实现了网管集中化监控管理。
(2)降低了维护管理成本
减少了新增工作站物理终端数量,降低了终端及空调设备投资成本支出,缩减了物理终端所占机房面积,节省并释放了机房机柜机位资源,降低了硬件维护工作量。通过实施虚拟机技术。工作站终端数量由目前的85台减少到19台,缩减了69个工作站终端,节省了15个机柜,7.3平方米机房面积。在减少能源消耗的同时,降低了机房散热量,减少了空气调节设备的运行时间,延长了设备寿命。共减少设备投资62.5万元,减少工作站终端69台,每年可节约设备能耗15.1万度。
(3)实现了提高劳动效率
实现虚拟化后,减少了网管巡视时间,提高了工作效率。
(4)提高了网管终端安全性
通过在不同虚拟机平台上进行业务系统平滑迁移,增加了网管终端系统硬件故障冗灾能力,为探索网管系统安全提供了一条新方法。采用虚拟机服务器 1+1备份方式,任何一台虚拟工作站终端发生故障,不会影响正常使用,通过克隆复制方式可以在不增加硬件的条件下快速再生成一个虚拟工作站,使应用程序的备份和恢复更为简单满足工作需要。
5 结束语
通过探索虚拟化技术在网管集中工作中的应用。为我们应用虚拟化技术积累了经验,同时为解决工作中的问题提供了一条途径及方法。对于其存在的缺陷与可靠性等问题我们仍在测试之中。
目前,我们对虚拟化技术的应用仅仅局限于网管工作站终端的虚拟化整合,从应用程度上来看仅仅算是一个开始,随着应用中对虚拟化技术的进一步深入了解,未来几年,开展虚拟服务器、虚拟存储环境、“云计算”的应用将会出现长足的发展。