深入追踪 解决交换机无故重启故障

连接到电子政务内网平台,进行行政审批、行政处罚以及电子监察这方面的行政权力运行事项。为了保证电子政务内网平台能够高效、稳定运行,大楼网络管理员几乎每天都要对分布在各个楼层中的网络设备进行巡检,以便及时发现各种可能存在的问题。

交换机无故重启

近日,大楼网络管理员在进行正常巡检时,发现位于四楼的某交换机所有端口信号灯都不亮,而且该交换机的电源指示灯也没有被点亮,连接到该楼层交换机上的所有客户端系统都不能正常上网;经过仔细检查,网络管理员发现该交换机的电源输入模块可能存在问题,造成输入电源无法为该交换机正常供电。对于这样的硬件故障,短时间内只有重新更换新的交换机,才能解决客户端系统不能正常上网故障;想到做到,网络管理员立即从仓库里找来备用的同型号交换机,赶到故障现场,连上物理线缆并接通电源进行启动,原以为经过这样简单的设备替换操作之后,网络故障能够立即得到解决;可是,在替换交换机的过程中,网络管理员发现每次交换机启动稳定没有多长时间,它又会莫名其妙地重新启动,这是怎么回事呢,难道这个备用的同型号交换机也出现了问题?由于这个备用的交换机放在大楼网络管理中心的仓库里,已经有一年多的时间了,之前曾经测试过,该备用交换机的工作状态是正常的,于是就将它留在手头,以备日后不测之需;现在好不容易有了用武之地,怎么到了关键时候,这个备用设备就掉链子呢?于是,网络管理员决定好好地对这个备用交换机,进行一下全方面的检查、测试,看看究竟是真病还是在装病。

追踪故障原因

由于备用交换机连接到大楼电子政务内网平台之后,经常发生无故重新启动现象;为了方便追踪故障原因,网络管理员特地将它从电子政务内网网络中断开,并用笔记本电脑通过console控制端口单独与它进行连接。在连接好物理线缆后,网络管理员在自己的笔记本电脑中,依次单击“开始”/“程序” /“附件”/“通讯”/“超级终端”菜单选项,打开超级终端程序界面,在该界面中创建一个与备用交换机直接通信的超级终端连接,在备用交换机刚刚启动稳定的那一刻,进入超级终端控制窗口;当备用交换机再次重新启动时,网络管理员在超级终端控制窗口中,看到交换机后台系统提示说在启动过程中遇到了一个总线型故障,或许就是这个总线型故障造成了备用交换机不能长时间稳定工作。

起初的时候,网络管理员怀疑备用交换机的系统映像文件存在问题,造成了交换机的后台系统不能正常启动运行;现在,通过在超级终端控制窗口中对交换机的启动过程进行监控,网络管理员发现交换机的系统映像文件已经被成功装载,并且已经启动运行,这说明交换机无故重启故障与系统映像文件没有任何关系,这也用不着从网上下载更新最新版本的系统映像文件了。

既然备用交换机在启动过程中存在一个总线故障,那问题多半出在交换机的总线上;考虑到总线一般位于交换机的主板中,网络管理员下意识地认为交换机的主板可能存在问题,多年来的维修习惯,促使网络管理员决定打开备用交换机的外壳,看看对应主板是否存在明显的问题。

想到做到,网络管理员立即找来螺丝刀,拧开交换机背面的所有螺丝钉,移走交换机外壳,取出交换机的主板,借助放大镜仔细观察了主板上的每一个电子元件,发现它们都没有明显的烧毁迹象,只是每一个电子元件表面都覆盖了比较多的灰尘,难道是这些灰尘在暗中“捣乱”?为了排除灰尘因素,网络管理员决定还是先将覆盖在主板元件表面的灰尘清洁干净;说到做到,网络管理员立即动手,拿来了专门清洁电脑主板灰尘的细软小毛刷,认认真真地对主板的各个“角落”进行了一次全面、彻底地大扫除。在确认灰尘被清洁干净之后,网络管理员又按照正确的操作方法,小心翼翼地将交换机的主板恢复原位,同时安装好交换机外壳,并且拧紧固定螺丝;接着,连接好物理线缆,同时接通交换机的输入电源,通过超级终端监控窗口进行观察,网络管理员看到交换机这次启动顺序一切正常,并且能够进入交换机后台配置界面了,这下让网络管理员感觉到非常意外。

由于在这次启动过程中,网络管理员没有发现系统提示说有总线型错误,难道清除了覆盖在交换机元件表面的灰尘后,交换机的工作状态真的正常了?网络管理员还是有点不放心,他再次切断备用交换机的电源,过一段时间后,重新接通它的连接电源,让交换机系统进行重新启动,在启动过程中他通过超级终端程序窗口监控到交换机引起顺序正常,同时也没有发现总线型错误的提示,看来问题真的是由覆盖在交换机电子元件表面的灰尘引起的。

故障总结反思

经过仔细分析,网络管理员认为一直存放在大楼机房仓库的备用交换机,之所以不断地进行重新启动,就是由于不起眼的灰尘惹的祸。经过检查发现,大楼机房仓库的卫生环境很差,自大楼建好以后,这个仓库几乎就没有怎么打扫过,里面的地板、墙壁以及其他各个角落,到处都布满了灰尘,人在仓库的地板上走动时,都能留下很清晰的脚印;在这种灰尘漫舞的环境下,备用交换机由于包装好,灰尘趁机“溜”到交换机机箱内部,覆盖在电子元件表面。再加上平时大楼机房仓库通风效果不好,备用交换机在里面放置的时间比较长,这样就导致电子元件表面的灰尘是越来越多,而且灰尘在吸收了空气中的水蒸气后,造成电子元件表面变得很潮湿,所以当日后网络管理员接通交换机电源后,就容易出现类似总线错误的故障,严重的时候,能直接烧毁交换机的电子元件。如此看来,空气中的灰尘虽然不是十分起眼,但是它对交换机之类的网络设备的影响是很大的。

为了保证局域网网络能够始终稳定地运行,我们建议各位网络管理员在做好网络的管理、维护工作外,也需要做好定期对网络设备进行清洁卫生的工作,同时保证网络设备能够一直工作在一个整洁、干净的环境中,此外还需要对一直存放的备用网络设备进行定期通电测试,以避免上述故障再次发生。