全面解析中石油总部部署美信科技云网管

一、摘要

中石油总部大楼技术支持维护是该公司信息技术服务中心与其他公司共同合作开展的工作,主要负责维护总部大楼的机房、系统、网络、桌面、应用业务等的正常运行。通过部署MXsoft公司的“CreCloud云网管”,实现了对总部大楼数据中心和核心业务应用的全面深度监控,成为IT系统正常运行的保障。

二、引言

随着信息化发展的加速和深入,总部大楼的IT系统和网络越来越复杂,各级单位对网络正常运转的依赖性逐渐增大,IT和网络应用逐渐融入到单位的日常工作中。网络基础设施和各种应用系统在不断增加,一旦IT系统和网络运行出现问题,将会对所有的依赖于信息化平台的正常工作产生影响。因此,高效的系统与管理已经成为总部大楼信息化建设是否成功的重要条件。

三、选型

综合国内各大行业用户的IT系统和网络建设,中石油总部大楼IT业务系统管理的长期目标是应该是建设一个能满足“集中监控、集中维护、集中管理”现代化网络管理模式需要的,面向业务、面向市场的IT 业务管理系统,实现端到端的管理,全面保障用户的IT业务系统的高效稳定运行,帮助管理工程师提高工作效率,从而提高IT资产的投资回报率。

要实现这一长期的管理目标,需要借助IT业务管理系统的有效部署来实现。我们在选择和部署IT业务管理系统的时候,最关心的焦点问题如下:

l 减少了多少IT业务系统发生宕机或者其他故障所带来的风险?

l 是否从根本上降低了管理和维护的复杂度?

l 帮助用户节省了多少时间,提高了多少效率?

美信实时监测系统的最终目的是通过解决上面的三大问题,从而帮助我们提高IT资产的投资回报率。基于以上的考虑,我们部署了最先进的“CreCloud云网管”美信实时监测系统。

四、主要技术

中石油总部大楼采用的“CreCloud云网管”是一套综合管理平台,可广泛应用于对局域网、广域网、城域网和关键IT业务系统中的路由器、交换机、防火墙、负载均衡设备、服务器、操作系统、数据库、中间件、网站、域名、URL、OA、CRM、ERP、SCM、HIS等各种IT网络组件和业务系统进行7X24的持续监控、不间断的数据采集和分析,对错误和故障数据进行颜色、声音、短信息、邮件等多种方式的报警,提供多种图形和报表帮助用户进行故障分析和性能诊断。下面就以这款软件为例,简要说明其中的技术原理。

1、 “CreCloud云网管”技术架构

美信实时监测系统为C/S架构,C++语言开发,采用最新的“云计算”方式部署,即透过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统经搜寻、计算分析之后将处理结果回传给用户。透过这项技术,网络服务提供者可以在数秒之内,达成处理数以千万计甚至亿计的信息,达到和“超级计算机”同样强大效能的网络服务。

2、 监控技术

美信实时监测系统集成了目前所有主流的远程监测技术,利用独立开发的主动预测式动力引擎(TaskDispatcher)实现海量秒级监测。

1) Agent

通常指代表一个应用程序处理查询并返回结果的软件,驻留在所有受管设备中并向管理站报告指定变量值的过程。美信实时监测系统的Agent监测代理利用c语言开发,同时支持Windows和Unix/Linux。在对服务器进行监控时,凡是通过SNMP、WMI、TELNET(SSH)等方式可以监测的数据,Agent都可以监测到。Agent监测模块更可以监测到通过以上这些方式无法获取的数据,比如帐户的安全性监控,占用系统资源的TOP5进程监控,文件的安全性监控,数据库日志文件监控等。通过此功能,美信实时监测系统完全实现了对被监测系统的全方位监测。

2) Ping

使用 Ping可以根据计算机的 ip 地址验证与远程计算机的连接,通过将 ICMP 回显数据包发送到计算机并侦听回显回复数据包来验证与一台或多台远程计算机的连接,该命令只有在安装了TCP/IP 协议后才可以使用。利用此功能,让监测人员可以实时了解所监测服务器、网络设备和各种应用地址的通断情况,在设备出现状况时,第一时间做出反应。

3) SNMP协议

SNMP(Simple Network Management Protocol,简单网络管理协议)的前身是简单网关监控协议(SGMP),用来对通信线路进行管理。随后,人们对SGMP进行了很大的修改,特别是加入了符合Internet定义的SMI和MIB体系结构,改进后的协议就是著名的SNMP。SNMP的目标是管理Internet上众多厂家生产的软硬件平台。SNMP运行过程:驻留在被管设备上的AGENT从UDP端口161接受来自网管站的串行化报文,经解码、团体名验证、分析得到管理变量在MIB树中对应的节点,从相应的模块中得到管理变量的值,再形成响应报文,编码发送回网管站。网管站得到响应报文后,再经同样的处理,最终显示结果。通过这种协议,美信实时监测系统不用知道对方服务器的用户名和密码便能通过IP地址实现对所监测服务器的CPU、内存、磁盘利用率、进程和服务等各项指标的监测。

4) TELNET、SSH

Telnet协议是TCP/IP协议族中的一员,是Internet远程登陆服务的标准协议和主要方式。它为用户提供了在本地计算机上完成远程主机工作的能力。Telnet远程登录服务分为以下4个过程:

a)本地与远程主机建立连接。该过程实际上是建立一个TCP连接,用户必须知道远程主机的IP地址或域名;

b)将本地终端上输入的用户名和口令及以后输入的任何命令或字符以NVT(Net Virtual Terminal)格式传送到远程主机。该过程实际上是从本地主机向远程主机发送一个IP数据包;

c)将远程主机输出的NVT格式的数据转化为本地所接受的格式送回本地终端,包括输入命令回显和命令执行结果;

d)最后,本地终端对远程主机进行撤消连接。该过程是撤销一个TCP连接。

SSH(安全外壳协议)是一种在不安全网络上提供安全远程登录及其它安全网络服务的协议。主要有三部分组成:

a)SSH-TRANS提供了服务器认证,保密性及完整性。此外它有时还提供压缩功能。

b)SSH-TRANS 通常运行在 TCP/IP连接上,也可能用于其它可靠数据流上。

c)SSH-TRANS 提供了强力的加密技术、密码主机认证及完整性保护。

通过这两个协议,可以让美信实时监测系统对Unix、Linux和AIX等非windows系统进行监测。也让这一监测平台涵盖了目前流行的全部操作系统。

5) ODBC

ODBC(Open Database Connectivity,开放数据库互连)是微软公司开放服务结构(WOSA,Windows Open Services Architecture)中有关数据库的一个组成部分,它建立了一组规范,并提供了一组对数据库访问的标准API(应用程序编程接口)。 一个完整的ODBC由下列几个部件组成:

a)应用程序(Application)。

b)ODBC管理器(Administrator)。其主要任务是管理安装的ODBC驱动程序和管理数据源。

c)驱动程序管理器(Driver Manager)。驱动程序管理器包含在ODBC32.DLL中,对用户是透明的。其任务是管理ODBC驱动程序,是ODBC中最重要的部件。

d)ODBC API。

e)ODBC 驱动程序。是一些DLL,提供了ODBC和数据库之间的接口。

f)数据源。数据源包含了数据库位置和数据库类型等信息,实际上是一种数据连接的抽象。

美信实时监测系统利用此功能实现了对ORACLE、SQL SERVER、MYSQL、SYBASE、DB2、INFORMIX等目前主流数据库的Buffer状况、内存、用户、Cache、请求、表空间、读写性能等各项指标的监测。

6) QoE

QoE(Quality of Experience)可以理解为用户体验或者用户感知,即终端用户对网络提供的业务性能的主观感受。它可以通过接近量化的方法来表示终端用户对业务与网络的体验和感受,并反映当前业务和网络的质量与用户期望值之间的差距。通过此功能,美信实时监测系统模拟终端用户去访问一个被监测的URL或应用时,通过返回值可以及时得知此服务的运行状态,从而实现监测功能,此功能主要用于测试网页的访问状态是否正常。

四、结论与建议

美信实时监测系统部署在总部大楼的时间已经两年多了,在这两年里,产生各种预警信息2万余条,预警重大事故2次,报警信息范围涉及网络、场地、系统、门户等各个方面,为领导决策提供了重要帮助,很好的起到了第一道防线的作用。