如何在灾难恢复规划中避免“人为事故”

当提起容灾话题时,人们一般都会联想到物理设备的损坏,这类事件通常由天气相关的原因,或其它各类事件所引起。不过我想要提到还有一些人为因素所引起的业务中断。

通过本文将将了解到:什么是人为引起的灾难?这类事故所引起的原因是什么?其如何对IT灾难恢复规划产生影响?以及如何进行避免?

在本文中,“人为引起”的事故并不指恐怖袭击事件,这类事件中的事故是人为有意引起的;所关注的是那些在运营、连接、数据传输或存储过程中出现的问题。这其中的一部分可以通过安装预防式的软件产品加以避免。

以下是最常见的人为事故:

员工问题

可以考虑在办公环境中部署“安全桌面”策略来控制办公电脑可以使用哪些设备、访问哪些网站。强制程度可以根据你所希望达到的开放或限制程度,不过需 要记住一旦打开了这扇大门,这意味着就可能有不受欢迎的软件进入你的环境。同时需要考虑每次同步个人设备,比如黑莓手机或iPod时,你所下载到设备上的 软件业可以连接到你的电脑上。有些应用程序并不像你所想的那样没有恶意。你的员工是否被允许在办公室使用Facebook或访问个人邮件?这可能会是恶意 软件的一个潜在的藏身之所。

还有一个风险是无法预估的,恶意软件可能内置在非恶意软件之中。这意味着任何通过USB端口连接你电脑环境的存储设备都可能成为潜在的威胁。你如何预防这一问题?你必须限制USB端口访问。一些企业甚至限制CD使用,不过这取决于你的企业环境。

无线网络和安全性

密码可以提升无线网络的安全性,不过确保其不会轻易地被入侵者所破解。一些企业具有多个无线环境,允许来访者连接互联网而不是公司内部网络。同时, 小心使用在有些环境中可用的公用Wi-Fi连接。坐在你身边的用户可能正在努力攻击你连接在无线上的电脑。一些电脑专家甚至还可以传输数据到你的笔记本 上,并通过此连接到你的网络上。

电力

确保不间断电源(UPS)设备可以足以支撑你所要求的电耗。许多企业在升级其数据中心时往往会忽视其UPS设备是否可以支持新的变化。专业的电力工 程师可以判定对UPS的规格要求,以及你可以从UPS处获取的服务时间。也可以通过安装UPS监控设备提醒用户可能出现的问题。

如果你有发电机,确保至少每年测试一次,同时确保发电机可以提供足够的电力来运行整个数据中心。同时保证发电机可以在故障发生时自动启动,除非你在现场配有人员进行手动启动。

网络问题

我们再看下网络。你的企业是否采用网络语音电话业务(VoIP)作为电话系统?假设你采用了这种技术,那你就要知道语音通讯和所有的数据流共享同一 网络。当你的网络出现中断时,你的通讯亦受到影响。近期我访问了一家企业,其在客户支持中心中采用VoIP技术。原因有两点,降低成本,以及在人员离席时 来电的重定向。问题是其经历了高达6个小时的网络中断,丢失了所有通讯。

VoIP还有一个问题是所有设备都需要电力,因此除非你在每个坐席上都配置一个UPS或将其连接到发电设备上,否则断电就意味着通讯中断。为降低这种中断的可能,请确保电力问题可以得到解决并实时监控网络。记住网络对于语音和数据通讯都是至关重要的。

一些潜在的关键网络问题可以通过很简单的方式解决,比如看下局域网中心室内和地板下、隐蔽处电缆的情况。如果那看上去就像是一碗面条,技术人员如何跟踪连接来进行检查?一个整洁,标记有标签的电缆配置可以避免长期的中断情况。

你还要考虑到数据中心周边的情况。我曾看到过有数据中心正位于一家自助餐厅后面,餐厅中准备热食。自助餐厅中或食物加热处可能引起的火灾,以及火灾引起后的消防措施都会对边上的数据中心构成损坏。

除非你可以建立一个完全无人干预的环境,你都必须想到人为的可能引起的灾害。这并不是要建立完全无故障的系统,只为避免经常听到的“人为事故”。