只要严格遵守这五条简单的规则,我们的数据中心就能够避免虚拟机过度膨胀的问题
任何一位尝试过搭建服务器虚拟化环境的技术人员,都一定对虚拟化技术所带来的极高灵活性印象深刻。我们日常工作中经常遇到的任务,例如部署新的应用程序服务器、创建一套完整的多服务器开发环境或者测试一款新的软件包,在虚拟化技术的帮助下往往只需要花费传统物理环境部署耗时的几分之一即可轻松搞定。更令人惊喜的是,打造虚拟环境几乎是完全免费的:我们既不需要申报新的硬件采购单,也没必要等待设备运输及安装,就连机房里的机架都用不着拆装甚至挪动。
然而,凡事有其利必有其弊。很多情况下,虚拟化的灵活特性反倒成为导致虚拟机数量无限度膨胀甚至失去控制的罪魁祸首。如果任由这种态势发展下去,虚拟机最终必然会带来严重的安全及授权许可问题——更不用说随之而来的对存储资源的无限需求。
好在很多商家已经意识到用户的这类需求,目前市场上已经出现一系列相关管理产品,用以解决虚拟机生命周期管理领域的挑战。然而,如果大家的企业规模较小,没有多余的资金(或者时间)用来打理这些管理工具,又该如何应对呢?别怕,希望以下五项提示能够帮你解决遇到的麻烦。
规则一: 虚拟机并不是免费的
尽管我们都能在眨眼之间就部署出一套虚拟机来,但事实证明,它们可并不是免费的。计算增量及存储资源的占用必然会带来运营成本的提高,但这也只是额外支出的一小部分。除此之外,操作系统本身的使用许可以及其它配套工具的不断增加同样会令最终看到账单的管理者大吃一惊——杀毒软件、安保机制,虚拟机绝对是个扮猪吃考虑的坑钱好手。为了保证虚拟机体系的正常运转,我们不仅要为其扩展足够的存储空间,还需要为其配备高效备份系统。
只要在Excel中列出虚拟机系统的养护与运营条目,我们就能快速创建起合理而准确的成本预估模型。经过严密的统计及计算,我们会发现虚拟机会带来大量额外开支,这样的结果相信一定能说服盲目推崇虚拟化技术的企业决策者们。如果当前资源相当紧张,而用户坚持主张技术人员应该利用虚拟环境解决实际需求,那么这份成本清单也会成为教育他们的有力武器——事实证明,快速与便捷根本不可能与免费划上等号。
规则二:别总拿“暂时”当借口
结合我的个人工作经历,虚拟机扩张最严重的领域要数测试及开发环境。由于虚拟化技术使技术人员得以轻松创建一套完整的应用程序环境副本,因此我们常常看到员工非常乐于利用这些环境副本为即将到来的软件新版本、更新补丁或者培训教程提供演练场地。
每当我提醒大家为各种类型的系统备份购买授权许可或加以规划时,他们总是以“这只是暂时性方案,不用担心”为理由拒绝我的建议。其实在某些情况下,这种“不用担心”的态度往往可能带来罚款甚至是法律制裁等严重后果。
然而更常见的情况是,这些系统随着时间的推移逐渐就从“暂时的”变成了“长效的”。几年前,某位技术人员鼓捣出一套以近两周使用情况为基础的环境副本,而时至今日这套东西还是经常被用到——它没有授权许可、也缺乏安全保护,始终保持原状的虚拟环境如今已经成为企业不容忽视的定时炸弹。发生这类情况的原因多种多样,但我们一定要把握住底线,根据自己的经验与知识做出正确判断。从这个例子中,我们应该学会如何避免在任何“暂时性”计划中部署虚拟机 ——虚拟化技术只应服务于永久性计划,这是大多数人理解但没能做到的原则性方针。
规则三:明确所有者及责任人
每当一套新系统被创建出来,最重要的是弄清楚系统是应谁的要求创建出来,谁又最终为这套系统的运作负责。通过为每套系统指派惟一负责人——可以是系统应用程序分析师,也可以是系统的直接服务对象——我们将虚拟机一一落实到具体持有者身上,这样当系统的生产状态发生转变时(包括开发、测试、生产、衰退并最终淘汰等过程),我们才能始终使其处于有人在管的良性运行轨道上。而一旦缺乏实际责任人,多年以后我们很可能根本不知道某套虚拟机系统是否需要进行备份或者能否直接停止运行。
规则四:制定命名规则并坚持执行
随着企业中虚拟化环境的不断扩展,大家应该开始密切关注如何为自己的虚拟机命名并加以分类。假设大家目前手头只有10或20套虚拟机需要管理,那么追踪状态、分清彼此似乎并不是难事;但几年下来,虚拟机数量达到40或50套时,你还搞得清状况吗?即使身为管理者,我们能把一大堆虚拟机都打理得井井有条,但其他员工对我们的工作(或者随规模扩大而新加入的继任者)肯定会面对这一团乱麻而感到头昏脑胀。为了避免这种情况的发生,我们必须要制定严格的命名规则并坚持执行。
如果大家是VMware vSphere的用户,千万别忘了使用vCenter中的字段定义功能,它能让我们更方便地追踪自己的虚拟机信息。通过这种方式,我能够在一大堆虚拟机系统中成功找到自己需要的用户接触点、创建日期、预计关闭日期、备份方案/进度甚至是供应商支持信息。
规则五:超过三十天不用的系统必须加以清理
在大多数中型企业的虚拟化环境中,我们常常会发现很多处于关闭状态的虚拟机系统。产生这种情况的原因不尽相同,但通常是由应用程序升级或者淘汰所导致,而这些闲置中的虚拟机往往没有得到及时清理。
在以上几条意见中,这种情况是最危险、影响最恶劣的。首先,由于系统已经长期闲置,可能没人记得它原先的作用、由谁在负责或者是否还需要开启 ——在少数情况下,它就这么永远被遗忘在角落里了。而更重要的是,由于该系统已经处于脱机状态,因此它无法接受操作系统补丁更新或者杀毒/反恶意软件升级。机器里留着这么一个安全隐患,我们很可能会在使用旧设备时不知不觉将网络上的致命攻击活动引入企业内部。
因此,最好的办法是对闲置时间超过三十天的系统一概加以清理——无论它们原本的作用是什么,或者是否将来还会被用到。如果大家希望为可能出现的需求留一条退路,不妨考虑使用由Veeam公司推出的VeeamZIP这类免费工具。VeeamZIP能够为虚拟机系统创建一套存档副本,但同时保证该副本不可能在虚拟环境及主存储层中被随意启用。总而言之,保留长久闲置的系统不仅会造成资源浪费,更是对企业业务安全的潜在威胁。
无论大家目前效力的企业规模如何、今后又会发展到何种地步,认真处理虚拟机创建工作并制定适合的生命周期管理周期都是必不可少的一步。这些良性方针从短期来看似乎不会带来什么明显的成效,但随着时间的推移,懒散的管理方式最终会让你的存储网络不堪重负——那些用过一次就闲置起来的测试服务器或者微软突然发来的许可审计清单(这不是危言耸听,这种情况我已经遇到过多次了)都会瞬间将你击垮在地。千万不要到了那个时候,才追悔自己当初为什么不养成勤勉谨慎的好习惯。