当前位置:首页 期刊杂志

HostMonitor在气象信息网络系统运维中的应用

时间:2024-06-01

杨维发 鲍清

摘要:本文从气象信息系统业务监控现状入手,讨论了HostMonitor软件的功能和使用方法,并结合现有气象信息业务进行了案例分析。

关键词:HostMonitor;气象信息网络;监控

中图分类号:TP393.18 文献标识码:A 文章编号:1007-9416(2018)02-0050-02

随着我国气象信息现代化建设的推进和网络技术的蓬勃发展,各气象部门的信息网络系统资源日渐增多,业务系统的压力也越来越大,其运维也需要有专门的管理人员进行管理。要保证气象信息网络业务系统的正常运作,在未影响业务正常运作之前发现故障十分关键。这就需要从底层资源,如服务硬件,内存,硬盘,CPU等保障,但仅仅靠这些分散单一的手段往往是不足以对业务系统正常运作进行完善的保障[1]。

1 HostMonitor监控模块

HostMonitor监控对象分为网络状态监控、网页监控、邮件监控、硬件资源监控、服务监控、进程监控、文件监控、数据库监控、虚拟机监控、用户自定义脚本监控等十多类监控对象。

1.1 网络状态监控

Ping命令是测试网络连通性最基本的命令之一,通过策略配置让本地主机或者远程代理主机对目的IP地址进行测试,如发现丢包或无响应则等异常情况向管理员发出告警。此测试方法可用于测试服务器、交换机、路由器等网络设备是否在线,网络状态监控Ping配置界面如图1所示。

Trace命令可测试从源地址到目的地址之间经过的路由是否发生改变[2]。这种测试方法一般用在OSPF(动态路由)的备份网络环境中,一旦主线路或者设备发生了故障,Trace命令经过的路由就会发生变化,从而触发告警,网络状态监控Trace配置界面如图2所示。

1.2 网页状态监控

网页状态监控主要包括对FTP、HTTP、和HTTPS服务的监控。在气象信息传输业务中,FTP服务是最为常见的服务。例如自动气象观测站的观测数据就是通过FTP协议传输到省局服务器。如果FTP故障而未被发现,将影响到全省自动观测站数据的上传时效。HTTP和HTTPS监控主要是对WEB服务进行监控,对气象部门的门户网站和内部公文传输系统的监控尤为重要,网页状态监控配置界面如图3所示。

1.3 文件监控

目录/文件更新监控功能可以对文件目录或文件进行监控,即在设定的时间范围内监测目录中是否有新的文件产生,或者指定的文件的内容是否有更新[3]。此功能在气象观测上传、CMACAST资料下发以及FTP文件分发等业务中起到重要作用。例如对FY2G卫星图片每30分钟上传一次,可每40分钟对此目录进行扫描一次,如果目录更新时间早于40分钟,即说明传输可能出现问题。这样就能在10分钟内主动发现传输故障。另外部分农田小气候站小时观测资料的文件上传方式为追加方式,可以通过监控文件的更新时间来监视每小时数据是上传成功。

1.4 数据库监控

数据库软件是信息网络系统中重要的支撑软件,HostMonitor支撑包括Oracle、Microsoft SQL、MySQL、PostgreSQL、Sybase、Interbase等主流数据库服务的连通型测试。一旦发现数据库连接失败,会向系统管理员发出告警。数据库监控还可以通过ODBC进行数据检索查询,并对查询结果的指定字段进行对比,如果对比结果满足设置的条件即出发告警。此方法结合SQL查询语句可非常灵活地对数据库进行监控。例如对自动站每小时的上传数据进行查询,并对结果进行比较,可监控自动站数据上传的完整性和实时性。例如在整点5分钟后执行SQL语句select count(*) from T_R_AGME_SPE_ELE t where t.v01000=Q6865 and t.observtime >sysdate-(1/144),可查出农田小气候站Q6865前10分钟是否有新的数据上传,如果查询结果少于1,则表示上时次数据未上传。

1.5 进程监控

进程监控模块可以对本机或者远程代理端的进程进行监控,通过设置此进程数量的最大值和最小值来判定是否需要采取相应的措施。

2 HostMonitor告警操作方式

HostMonitor软件具有30多种告警方式,其中包括界面提醒、声音提醒、短信提醒、邮件提醒、ICQ提醒、停止服务、启动服务、重启服务、重启系统、写数据库表、SNMP SET、通过TCP/UDP端口发送数据、运行外部脚本或程序等。一般最为常用的告警操作是短信告警、邮件告警、写数据库和执行外部脚本,短信告警需要购买短信猫设备。

通过配置可任意组合这些告警操作,并保存为告警操作文件,根据测试方法或业务需求直接选择一些类告警操作。告警内容有可由160多个变量任意组成,包括测试方法、测试时间、测试结果、测试地址、成功次数、失败次数、成功比例、失败比例、状态改变时间等。邮件告警功能中,可以配置4个告警角色,可以把不同的告警内容发送给不同的角色[4]。

3 气象信息网络系统统监控案例

3.1 视频会商业务监控

省局视频会商系统是全国天灾害性天气视频会商系统的重要组成部分,全国天气会商会议包括每天固定时间的早间全国天气会商、气象台内部会商,每周一固定时间的全省天气会商,每月旬最后一天的全国中期会商,行业服务用户的视频会议,以及临时通知的不定期视频会商,值班人员要提前30分钟开启会商系统。视频会商系统的监控包括设备监控和业务监控,通过HostMonitor命令对MCU设备进行监控,一旦发现MCU设备死机或故障,可迅速采取应急措施,确保会商系统的正常运行。由于会商频次多,时间不分散,为确保值班员延误会商,可通过Ping命令对定时视频会商进行监控。设定每次会商计划前20分钟通过Ping命令判断会商系统的设备是否已开机。

3.2 RAID磁盘阵列监控

一般通用的应用监控软件都无法对RAID磁盘阵列信息进行实时监控,管理员无法在最短的时间内获得服务器硬盘故障信息,如果因为坏盘未被发现,可能导致系统奔溃或数据丢失。DELL公司针对DELL服务器开发的硬件监控程序可对RAID磁盘的状态进行监控,发现故障后可运行外部程序进行告警。可写一个创建空文本的脚本,一旦有硬件告警,会在指定目录生成一个文件。HostMonitor可利用文件/目录监控功能對此目录进行监控,一旦发现有文件生成即通过语音、短信、邮件等方式通知管理员此服务器磁盘出现了故障。

3.3 数据传输业务监控

电话语音告警系统接入中心有一套基于数据库的电话语音告警系统,系统实时监控数据库表,如果表中有数据记录,即根据协议自动拨号,并播放语音。HostMonitor的SQL Query告警方式能根据用户配置数据库表的写操作,从而实现HostMonitor监控的电话语音告警。

4 结语

HostMonitor是一款非常实用、成熟的IT业务系统监控软件,不仅功能齐全,而且价格便宜,特别适用于中小型机房和IT业务系统的运行保障。通过灵活的监控策略,结合完善的告警、日志、报表功能让IT业务系统运行保障工作变得简单轻松,运维工作大大减轻。

参考文献

[1]贺朝晖,柏磊.Hostmonitor软件在网络和系统监控中的应用[J].华南金融电脑,2007,(1):85-86.

[2]孙旭,熊淑华,张朝阳,熊文.基于Hostmonitor的网站系统监控设计与实现[J].计算机技术与发展,2012,(5):173-176.

[3]胡玉良,程冬焱.HostMonitor监控软件在山西地震前兆台网的应用[J].地震地磁观测与研究,2016,(1):131-135.

[4]齐振霞.一种基于HostMonitor软件的宽带城域网监控方法[J].河南科技,2013,(24):11-12.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!