在IT起步的最初,计算机和其他IT设备都非常的昂贵。为了保护这些花费数百万美元购买的设备,数据中心机房都采用配备空气过滤和大功率空调系统的玻璃房子来保持机器的冷却。用于冷却的电力成本相对便宜,而服务器则十分昂贵。因此,企业都尽量对服务器进行升级和维修来避免更换服务器。IT管理者们对于硬件故障非常头疼,因为一旦硬件出现问题就意味着机房停工而无法使用关键性商业应用软件和数据从而导致损失。
随着时间步入2008年。电力成本的价格随着硬件价格的快速上涨而不断飙升。多数数据中心目前还是以廉价工业标准化服务器为主。即使价格最昂贵的处理器也不过几千美元,像风扇这样的小型设备价格不到20美元。一些小型服务器互相连接起来形成了一套计算栅格,相应软件也围绕着所需的栅格向应用程序发展。像SAN(存储空间网络)这样的存储功能亦是如此。取代过去保持服务器和存储方式一成不变的做法,IT设备每隔五年就会进行更新换代,或者采用速度更快效率更高的最新系统。
既然这些廉价的设备只能使用较短的时间,那么为什么我们仍然要对数据中心进行冷却呢?我们为什么不关掉空调,打开窗户来维持数据中心的运转呢?这样的话就能节约大量在电力方面花费的金钱。从外面吹进来温暖的空气和夏天的风扇结合,重新循环来保持冬季办公室空间里的温度。当这个疑问摆在工业领域的众多IT生产厂商面前时,回答是令人惊讶的"我们也在对此保持关注"。显然,有关IT设备的这些问题主要介于当温度上升时是否会导致数据中心的平均故障率(MBTF)增高,没人希望我们的服务器和存储设备的故障率趋于上升。让我们一起关注当关闭空调后会发生些什么。通常来说机器内部的温度会攀升到40C左右然后保持不变,内部的风扇能避免发热的组件温度过高。服务器如果结合所有组件的平均故障率(MBTF)来计算MBTF,就会从平均7年的周期下降为5年。但是如果服务器的使用年限为5年的话,那也不算太坏。
在不同组件中,处理器是高温下使用最为频繁的组件。事实上目前所有的处理器都有过热监控器,能在温度超过处理器上限时关闭时钟或者核心。内存DIMMS也是如此,不过DIMM的故障率略高一些。目前内存容错是在DIMM出现故障时保持服务器运转的有效方法,在三年后更换DIMM要便宜得多。在电源过热时,备用电源就会启动。磁盘驱动器也是能看到MBTF(平均故障率)下降的一个组件。固态驱动器也是服务器驱动器的一个解决方案。这也是将重新设计磁盘驱动器将MBTF延长到7-10年的一个选择。像内存故障一样,磁盘故障因为有RAID的保护而不至于导致灾难性后果。那么在服务器使用的5年期限中只有风扇是最容易出现故障的组件了。但一个普通风扇的故障不至于导致服务器的当机。
以上分析的结果显示关闭电源所节约的能源可谓意义重大,计算机正常运行时间所遭受的风险也相对较小。因为不会再产生用于冷却的电力成本,数据中心的使用环境也能因此收益。我们需要将现有的服务器和服务相结合。淘汰过时的服务器并及时进行更换。担当关键性任务的应用软件也能在使用虚拟化的环境中运行。考虑到这一点,服务器可能只需要一些两年期的风扇来保持其在整个使用期限内的正常运转,这是个多么让人振奋的消息呀。