由于在过去的几年中功率密度急剧增加,IT 管理员很担心因气流不足而造成对 IT 设备的损坏。更为糟糕的是,至今还没有出台一套衡量比较一种机柜与另一种机柜的冷却功效的标准。这对于确保关键设备工作环境的高可用性十分必要。确保适当冷却的一个方法是配备通风面积在 0.53548 m2 (830 in.2) 以上的机柜门或开孔面积至少 63% 的打孔门。符合这些规格的机柜门可以向 IT 设备提供充足的“自然”通风气流。对于冷却较差的环境,建议对功率超过 1,500 W 的机柜额外 安装空气调节装置。有关机柜冷却这一主题的讨论,详见以下 APC 白皮书:
29 号白皮书:“高密度机柜供电方案”
44 号白皮书:“使用挡板改善机柜冷却性能”
46 号白皮书:“超高密度机柜和刀片服务器的供电和冷却”
50 号白皮书:“机柜设备的侧面对侧面气流冷却方案”
在调查中,提到采用性能不可靠的电路断路器的机柜配电盘,受访者都有不愉快的经历。这些价格低廉的电路断路器是一个常常被忽视的故障源。而且,如果断路器跳闸,有关人员就不得不接触到装满关键设备的机柜内部。他们不得不在配电盘上确定电路断路器的位置,这样就进一步加大了危险程度。如果将电路断路器放在同一块面板上,就可以减少这类问题,从而提高关键机柜的可用性。截至目前,提高机柜的电源可用性的最佳方法是为机柜增加冗余电源。机柜采用双电源供电后,可用性大为提高(即使是单线供电 IT 设备),受访者对 此均惊叹不已。有关这个主题的讨论,详见 APC 48 号白皮书:“各种机柜电源冗余配置的可用性比较”。
大多数可维修性难题是由直接参与服务器移植和技术更新的调查受访者提出的。很显然,这一领域的进步很大程度上有赖于实践经验。客户从同时提供缆线管理和服务器移植服务的机柜供应商那里获益匪浅,这是因为机柜供应商利用在此领域获得的经验改进了机柜设计。
受访者主要关心机柜内的环境和电源管理问题。这些管理难题与 APC 4 号白皮书中探讨的问题非常类似:
“下一代数据中心电源系统基本要求”和 APC 5 号白皮书:“下一代数据中心冷却系统基本要求”。不过, 从我们的调查(集中管理)中确实发现了一个独特的管理难题,它起因于服务器集群的数量不断增长。越来越 多的公司开始大量购买价格较为低廉的服务器,这类服务可以降低日常运营的成本并减少故障源。据 IDC 研 发副总裁 Jean Bozman 表示,集群技术的发展简化了安装和维护服务器机群的复杂程度。如今的 IT 管理员 可以购买预配置的、不需要专业 IT 技能(如脚本)的集群服务器系统。据 Dell 负责集群产品市场营销的高级 经理 Sanjay Sidhu 透露,集群产品正力图打入关键业务环境 1。但是,KVM 交换机并不足以管理所有这些装 满服务器的机柜,IT 人员希望有一种解决方案能够在一个地点对所有设备进行集中管理。
对应付适应性难题的解决方案要求是在预工程化和标准化机柜机柜的基础上提出的,此类机柜在现场无需工具即可轻易更改其柜门、侧面板和导轨等。要解决本次调查中所确定的机柜难题,必须对现有的设计思路进行一些变革。这些变化中的大部分是由于将机柜视为数据中心的心脏所引起的,因为公司的关键IT流程基本上都是在机柜级最终实现的。我们不应该再将机柜仅仅看作一个金属机柜,并且仅仅考虑其价格。如果设计得当,提供高可用环境的机柜机柜,可以显著增加正常运行时间和为公司节约成本。我们确实应该将机柜视为数据中 心或网络机房基础设施的组成部分,反过来,这些基础设施也要求机柜作为电源、冷却、安全、管理和火警探测系统的不可分割的一部分。只有这样,机柜供应商才能预见性地为本次调查揭示的问题以及以后可能出现的问题提供解决方案。
本文系统分析了客户在机柜系统方面的问题,从中明确指出了下一代关键业务设施的发展方向。当前的设计思路和设备没有解决的、最为紧迫的问题都有一个共同的核心问题,即数据中心或网络机房适应变化能力较差。 机柜系统必须对不断变化的要求有更强的适应能力,才能改善其可用性和成本效益。
在许多行业,随着在可靠性、周期、成本方面的进步对标准化、预工程化和模块化要求的进一步提高,行业均 达到了一定的成熟水平。关键业务设施及其所使用的机柜系统的设计人员和设施所有者都应该考虑是否达到了 这一点要求。IDC 预测,到 2005 年全球有 62% 的服务器以机架式机型出货。这就进一步印证了应该将机柜 视作关键业务设施的组成部分来设计的观点,而这一认识正是本次调查结果所揭示的。