警惕潜伏在机房空气中的“硬件杀手”

随着信息技术在企业中的普及、应用和深化,IT系统已经成为越来越多企业的"生命线",牵系着生产运营中的每一个环节,不可或缺。为了确保IT系统的持续健康运转,对于企业数据中心或机房中硬件设施的保护,也就显得尤为重要。然而,近一两年来,某些国家和地区的IT用户发现了不寻常地高的硬件设备损坏率,包括:电源,内存,甚至硬盘和CPU等,从而导致设备宕机或影响业务,极易对企业造成经济损失。难道是设备有质量问题吗?可是发生问题的设备来源广泛,并没有出现集中的品牌特征。厂商们在对受损元件进行检测时惊讶地发现,检测结果表明元件是完全合格的产品。那是什么原因造成了元件的损毁呢?经过考察,专家们终于找到了困扰大家的事故元凶–"蠕变腐蚀"!

"蠕变腐蚀"是指什么呢?这还要从一个良好的愿望说起。出于对人体健康和环境保护的考虑,欧盟在2006年7月出台了一项旨在促使所有IT和电子设备供应商采用更环保的制造技术的法规RoHS(Restriction of Hazardous Substances),这一标准严格规定了所有IT和电子产品中有毒金属或是对环保有影响和破坏性的重金属材料的含量。因此,很多IT和电子设备厂商都开始陆陆续续改进技术,使产品符合RoHS标准。

在这一过程中,需要克服务很多的技术和工艺难点。过往电路板中广泛使用锡铅合金作为保障焊接的材料,而铅是有金属,被RoHS明令禁止。在RoHS的限制下,目前电路板广泛应用的是一种叫做"浸银"(Immersion Silver)的表面处理技术,以银替代锡铅合金。从环保的角度来看,工艺的改良是必要的,但工艺的改变却同时给IT产品的可靠性带来了新挑战。

众所周知,银并不是一种非常稳定的金属,容易产生化学反应,在实际使用中,"浸银"处理过的电路板被发现在高含硫量和一定湿度的空气环境很容易被腐蚀,电路板中的银和铜被腐蚀产生衍生物逐渐在电路板上漫延,形成所谓的 "蠕变腐蚀"现象。"蠕变腐蚀"发展到一定程度会造成电子线路短路,从而导致设备部件故障。这也是前文提到的奇怪现象的由来。

然而,专家们发现,"蠕变腐蚀"所导致的设备故障并不是全球普遍暴发的,而主要集中在印度、中国等发展中国家,尤其是这些国家中以工业为主的城市。这些地区往往空气污染相对严重,控制不利,空气中硫化物和氯化物的浓度比较高,而这两者正是加速"蠕变腐蚀"的温床,会导致比一般情况下更高的IT设备故障率。与此同时,这些发展中国家和地区恰恰处于信息飞速发展,IT系统逐渐成为支持企业关键业务核心的时期,需要大量采购、使用IT设备并建设相应的机房,但值得警惕的是,据我们观察,目前还鲜有CIO和IT负责人意识到机房空气污染会对IT设备产生腐蚀的危害存在。

事实上,由于空气污染对机房中设备的腐蚀是长期而全面的,因此,它所产生的影响也是具有粘性的,也许短期内看不到问题出现,可一旦出现问题也将是IT设备的全面告急,所造成的损失绝不亚于任何重大IT设施故障,对企业生产和运营的影响将无法估量。值得指出的是,如果机房的空气质量得不到针对性改善,即使更换IT设备,还是不能避免"蠕变腐蚀"的继续发生,这就像一个定时炸弹,而最终受害的还是用户的业务运作。

目前,世界现行的机房环境标准对空气中硫化物含量的规定并未考虑"无铅化"电路板表面处理技术对环境的要求。为了帮助客户及时判定和避免"蠕变腐蚀"的存在,IBM根据针对铜腐蚀的国际标准ANSI/ISA S71.04-1985的G1级别(指机房适用级别),制订了自身针对银腐蚀的P1级别标准,即:IT设备暴露在空气里面30天,其所用铜及银试片的腐蚀程度要求低于300埃米(1埃米=10-10米)。现在IBM帮助客户建设的数据中心都严格遵循了这一标准,确保机房里的IT设备得到保护、用户之关键业务得到的保障。

此外,对于硬件设备的"隐形杀手"还有很多,如机房的温度、湿度和通风条件等,而越是精密、计算能力强的机器,也就越容易受到环境影响被腐蚀。如何才能在既能实现环境保护的良好愿望,又满足企业的信息化需求的同时,解除设备"蠕变腐蚀"的隐患呢?IBM率先提出的"机房空气质量评估和净化"解决方案可以通过评估、过滤和保持这三步帮助客户解决这一烦恼。

第一步是"空气质量评估服务",检测客户机房空气质量,判定机房有害空气危害程度处于哪个级别;第二步是"污染气体过滤实施服务",根据检测结果和客户机房的具体情况,比如规模、周边环境、通风走向等,设计、筛选和实施空气过滤方案,使机房空气质量达到ISA G1及P1等级;最后是"售后维护服务",为客户定期巡检空气质量和定期设备,对化学滤料进行寿命分析并根据需要更换,确保机房环境始终达到ISA标准。

本文作者为IBM全球信息科技服务部大中华区解决方案事业部总经理 吕永琛