过去十年中,数据中心产业已成为一个非常积极并发展相当迅猛的行业。这种扩张旋风同时创造了一系列的设计改进和一系列的技术进步,使的今天的一家典型的数据中心无论是从规模上、密度和可靠性方面较之几年前,都发生了戏剧性的进步。
然而,尽管在数据中心的设计和技术方面均已有了如此卓越的进步,这种进步仍然存在很大的局限性。人们仍在继续追求实现最富有成效的数据中心输出,以便平衡数据中心的可用性和能源效率的竞争约束。这方面的障碍因素往往既不是技术也不是金融问题,因为根本的技术已经存在,期望的投资回报往往超出了适当水平的承诺。相反,这些障碍需要克服来自中断相关的信息收集和共享的组织界限,并平行断开数据中心管理中团队和用户之间的业务流程。
什么是数据中心基础设施管理(DCIM)?
在过去的几年的时间里,数据中心基础设施管理这一术语一直在数据中心产业被广泛使用。这是用来描述一类管理软件,软件工具是面向物理数据中心基础设施的管理。管理物理系统的电网、冷却、网络连接,甚至IT资产,如服务器和存储设备。
但是,数据中心基础设施管理所面临的一个挑战便是,其一直缺乏一个简洁、并且能够普遍被人们所接受的定义。值得庆幸的是,数据中心的分析师、媒体、软件供应商以及系统的最终用户已经就什么是数据中心基础设施管理普遍比较了解了。
数据中心基础设施管理的定义可以概括如下:
“数据中心基础设施管理(DCIM)系统收集和管理数据,包括数据中心的资产、资源利用情况和整个数据中心的生命周期的运行状态的数据。然后将这些信息以分布、集成、分析和应用的方式,帮助管理者满足业务和面向服务的目标,优化数据中心的性能。”
这个定义强调对物理基础设施的“资产”,以及常见的软件功能,如数据收集和分析的考虑。此外,它突出了软件和数据中心的业务流程和服务的联系,如正常运行时间、效率,以及变化和容量管理等领域之间的连接。
数据中心基础设施管理:收集、分析和采取行动
在这里要了解的最重要的是其核心,数据中心基础设施管理是关于数据资料收集,然后根据完整的相关信息,对物理基础设施采取相关措施。这些信息需要准确反映当前的相关状态,即在任何时间点的数据中心(时间可以以年、月、日、小时、分钟、秒或微秒来衡量),以便支持准确和明智的决策。在理论上,这应该是一件简单的事情,所有记录数据中心基础设施技术的仪器和仪表早已经在收集这些相关数据了。
信息障碍
然而,在实践中,许多数据中心基础设施管理信息不通,很可能从基础设施的任何智能设备收集数据,这样工具给出的数据便是不可行的。无论是信息被保存在分立筒仓,以满足特定的专家用户群的需求,或聚合成一个单一的“主系统”,软件本身缺乏必要的详细的细节,任何专家用户无法有效地执行他或她的工作。一个更有效的办法是利用开放的通信协议和建筑师的沟通途径,使数据可以很容易地聚集到任何专家系统的详细信息,并可以在系统之间交换。下图1便是一个简化的通讯架构,比较这些不同的数据中心基础设施管理方法。
数据中心基础设施管理系统通信体系结构比较
整合的方法克服了其他方法过去和现在的信息壁垒,往往可以利用现有投资,购买仪器和系统。此方法大大提高了用户之间的协作机会。此外,固有的模块化系统之间的连接,允许未来介绍更新的新功能具有更多的灵活性。
克服信息的障碍:一种整合的方式
信息,在其本身,是平衡决策的基础,这是DCIM文件软件进场。从本质上讲,对于大型零件来说,数据中心运营商捕捉数据中心基础设施的性能相关信息的能力,在几十年前就已经具备了。
对于大多数数据中心来说,目前的状态是可以归类为数据中心基础设施管理的是一个独立和“封闭”的监测,规划和控制系统的一个集合。通常情况下,有至少有一个软件工具为每个物理子系统服务:电器、制冷、机械、IT基础设施、IT资产等。这是在一个相当浩大的基础上建立的,断开各种专家用户和信息系统之间的连接可能导致明显的严重缺乏连续性,经常变化的设想和实施可能有利于某一个地区,但可能会导致在其他领域的相应费用上升。
PUE
例如,数据中心运营商目前的重点便是要提高电源使用效率(PUE),同时需要结合减少能源的消耗和降低能源成本。在表面上,目标都是为了提高效率,这些目标应该是一致的,改善一个地区的效率应带来其他效益,但这并非总是如此。在许多企业中,负责IT基础设施和测量PUE数据的团队与负责支付企业电费和以达到整体能源效率目标的团队之间并没有太多的联系。两个部门之间没有适当的沟通,而且他们使用管理各自领域的专业知识和信息系统之间也相互独立。这样如果 IT基础设施团队进行改革,改善了PUE,但却会导致企业全面能量消耗和成本的增加。
例如,IT团队正在寻求改善PUE,将PUE值从1.9降低到1.7,并决定采用最好的办法提升电脑室空调(CRAC)出口温度几度。由于PUE是转换效率指标,是比较由IT资产消耗的能量和配套设施传递的能量(PUE值为2仅仅意味着,每传递1千瓦时的IT负载需要消耗电力2kWh),而额外传递的能量则用于创建和提供的冷空气使服务器保持适当的温度,这样就增加了机房空调温度,减少配套设施,提高了能源转化率。
这种战略是成功的,并且也确实改善了PUE值,但有一个意想不到的后果。随着暖空气到达服务器,这些服务器的配套设备必须做更多的工作,以保持服务器冷却。在这种情况下,服务器所消耗的额外的能源远远超过了通过降低机房空调温度而节约的能源。基本上,IT团队虽然达到了他们的度量指标,但整体数据中心的能源成本将会更高。
综合方法
将用户,部门和信息系统连接起来可以允许一个更加平衡和全面的方法来有效的进行数据中心基础设施管理。
鉴于相同的PUE/能源效率方案,通过整合系统预期的变化可以模仿PUE和能源效率的潜在影响。IT团队可以发起一个讨论,与基础设施小组讨论以确定相关的方法,达到PUE的目标。但也认为,其间接影响能源消耗和成本。而机房空调温度仍然可以增加,团队集体确定从服务器到机房空调的管道的热量,而不是允许混合的数据中心的空气,创造一个更好的平衡,PUE仍然不断减少,而整体能源使用和成本效益也得到了改善。
整合数据中心基础设施管理带来改善的洞察力和决策支持
上面介绍的PUE的例子仅仅是旨在说明模块化和整合数据中心管理解决方案的潜在好处,作为一种积极和有效的数据中心管理手段。一套完整的数据中心基础设施管理的实施可以成为跨所有数据中心的业务流程,包括资产管理、变更和容量规划、危机管理、能源和资源的可持续性,以及始终存在的财务管理的挑战,提高洞察力和决策支持的关键连接点。
较之孤立的独立部分系统或通用的单片机系统,整合数据中心基础设施管理的方法利用模块化和开放的数据和信息的连接。为每个专家用户提供了正确的信息,并提供了实现这些用户连接和协作,实现平衡的机会。