使用Nagios工具 避免遭受网络问题困扰

Nagios是一个用于系统和网络监控的开源工具,系统管理员可以用它来定义告警和紧急状况。系统的状态可以从显示绿色、黄色或是红色状态信息的Web页面进行监控。管理员还能通过电子邮件、SMS短信或即时信息获知状态的改变。使用管理员定义好的条件,Nagios能快速地定位网络中需要关注的组件。

Nagios提供两种类型的检查:主机检查和服务检查。主机检查测试系统是可达的,通常是通过ICMP 协议的Ping实现。服务检查会分析单独的网络服务,例如SMTP、HTTP或DNS,但是同样也会检查进程的状态如可用的内存、磁盘空间、日志或CPU使用率。服务检查是十分复杂的,不仅检查指定的端口是否开放,而且测试连接返回的特定信息如SQL查询的响应。

Nagios是高度模块化的,使用许多插件来进行服务和主机检查。预封装的插件能节省管理员大量的工作。可以使用技巧性的脚本来创建额外的自定义脚本,尽管你可能发现需要做的仅是在Nagios Exchange网站上大量用户自创建的插件中进行搜索。

作为一款开源软件,Nagios在GNU的条款下授权。Nagios运行在Linux系统上,但是它基于浏览器的接口允许从任意平台上进行操作控制。从Nagios网站下载用于主监控守护进程的TAR文件、CGI和HTML接口。安装过程稍显困难,但是运行Nagios很简单。配置文件提供了模版,用于定义检查类型,检查、重试的间隔,告警通知和要通知的单独的用户组。状态变化会触发轮询间隔变化或告警,但一旦Nagios侦测到是系统级的问题时,它有足够的逻辑,是不会不停地发送告警的。

我抱怨的是,尽管使用配置文件简单易懂,但这些脚本应该可以提供图形化的前端。不过就Nagios的可配置性、强大的报表和扩展性来说,如果只允许使用一个开源网络监控工具的话,我会选择它。