思科近日发表通告,其代号“加利福尼亚”的统一计算系统(UCS)上应用的高端B440刀片存在一个潜在的致命缺陷,可能会导致一个或者多个主板过热失效,并可能会令主板爆出火花,给系统管理员带来危险。
上周,思科在网站上对应用UCS B440的刀片服务器用户发表了一个通告(请点击),表示该刀片上的MOSFET功率晶体管失效会“导致主板组件过热并且可能会出现短暂火花,导致整个主板失效”。另外,思科还表示“该故障在极端条件下可能会影响机箱中的其他刀片”。
受影响机型
思科实际上早在2011年6月12日已经通告客户MOSFET存在一些问题,但不是普遍的,当时思科表示“并没有明显的MOSFET组件带来的系统故障,被观察到的故障是一个随机的组件故障”,思科系统工程师可以为刀片更新一个firmware补丁来防止MOSFET过热或者爆出火花。
然后在今年的1月26日,思科修改了通告,表示应用B440服务器的用户这个firmware已经检测出MSSFET的故障是“潜在的发热事件”,但固件分发后,B440还是会出现故障,于是,思科对B440主板进行了硬件修改,并开始替换所有现有的机器配置。
思科在通告中表示UCS B系列刀片和C系列机架服务器并不存在MOSFET故障问题。
如果用户正在应用B440系列服务器,思科建议用户升级最新的UCS刀片管理控制软件,其中包含了监控B440 MOSFET的升级补丁,并建议用户尽快替换刀片。
思科UCS B440-M1刀片在2010年4月发布,是一款双宽刀片,采用四插槽设计,基于英特尔八核心“Nehalem-EX”至强7500处理器。其四插槽C460-M1机架服务器在设计上有所不同,没有受到MOSFET问题的影响。思科在2011年3月发布了升级版的B440-M2刀片,支持十核心的“Westmere-EX”至强E7处理器。
预计思科很快会采取行动,可能会召回这些故障服务器。