一种基于机房运维管理平台的告警系统技术方案

技术编号:23088117 阅读:17 留言:0更新日期:2020-01-11 02:13
本申请提供一种基于机房运维管理平台的告警系统,包括运维管理平台、被控设备以及环境监测器。其中,环境监测器可采集所属厂区范围内的环境监测数据,并向运维管理平台发送环境监测数据。被控设备可通过外接数据采集设备或者自带的性能状态采集模块将自身的状态信息及时的传输给运维管理平台。运维管理平台可以定期从被控设备接收环境或设备日志;如果未接收到环境日志,从被控设备终端相匹配的环境监测器接收环境监测数据;以及根据环境日志或环境监测数据生成告警信息。所述告警系统可以未接收到环境日志时,通过环境监测器获取环境监测数据,从而判断是否存在设备异常,以提高告警的时效性。

An alarm system based on the operation and maintenance management platform of computer room

【技术实现步骤摘要】
一种基于机房运维管理平台的告警系统
本申请涉及计算机运维管理
,尤其涉及一种基于机房运维管理平台的告警系统。
技术介绍
大规模企业,如钢铁企业,的生产中需要在不同的厂区范围内布置机房,机房中包括多个计算机主机,以对生产环境参数和生产技术参数进行实时监控、设定和处理,保障生产过程的有序进行。对于大规模企业,其机房运维状况需要统一进行维护管理,以及时发现各厂区突发的技术故障,统一进行调配管理。为了实现上述过程,实际应用中需要针对各厂区构建运维管理平台系统。典型的运维管理平台系统包括管理平台和分布在各厂区机房内的被控设备终端。其中,管理平台可以是统一部署在中心机房的管理服务器,各个被控设备终端统一与管理平台建立通信连接,以将其运行状态数据发送至管理平台进行分析处理。当任意一个被控设备终端出现数据异常时,管理平台可以根据接收到的数据生成告警信息,通知相关技术人员进行处理。可见,当前管理平台告警信息的生成,需要以各厂区范围内的被控设备终端所收集数据为基准,即被控设备终端收集的数据的准确度,直接影响到管理平台的判断准确度。而当被控设备终端出现故障宕机时,其无法将数据传送给管理平台,造成此时被控设备终端已经出现技术故障,但管理平台因未接收到数据,而不能判断其故障,即造成误判,使技术人员无法接收到相关告警信息,因此不能及时进行处理,造成告警时效性低。
技术实现思路
本申请提供了一种基于机房运维管理平台的告警系统,以解决传统管理平台告警时效性低的问题。本申请提供一种基于机房运维管理平台的告警系统,包括:运维管理平台和多个被控设备终端;多个所述被控设备终端分别布置在多个厂区范围内,以收集所属厂区的运维数据;多个所述被控设备终端与运维管理平台建立通信连接,以将收集到的所述运维数据发送至所述运维管理平台。还包括设置在各厂区范围内的多个环境监测器;多个所述环境监测器与所述运维管理平台建立通信连接;所述环境监测器被配置为采集所属厂区范围内的环境监测数据,所述环境监测数据包括温度信息、湿度信息以及网络状况信息中的至少一种信息;以及向所述运维管理平台和所述被控设备终端发送所述环境监测数据;所述被控设备终端被配置为接收所述环境监测数据,以及根据所述环境监测数据建立环境日志,并将所述环境日志发送至所述运维管理平台;所述运维管理平台被配置为定期从所述被控设备终端接收所述环境日志;如果未接收到所述环境日志,从所述被控设备终端相匹配的所述环境监测器接收所述环境监测数据;以及根据所述环境日志或所述环境监测数据生成告警信息。可选的,所述告警系统还包括多个被控设备终端,多个所述被控设备终端被预先设置为多个运维权限;所述运维管理平台被进一步配置为:获取所述告警信息对应的所述被控设备终端的管理权限,匹配所述运维权限高于所述管理权限的所述被控设备终端;以及向匹配的所述被控设备终端发送所述告警信息。可选的,在向匹配的所述被控设备终端发送所述告警信息的步骤中,所述运维管理平台被进一步配置为:遍历多个匹配到的所述被控设备终端的运维权限;以及,优先向运维权限低的所述被控设备终端发送所述告警信息。可选的,所述被控设备终端被配置为:获取处理动作信息,以及根据所述处理动作信息生成反馈信号,并将所述反馈信号发送给所述运维管理平台;所述运维管理平台被进一步配置为接收所述被控设备终端的反馈信号;以及,如果在预设处理时间内未接收到所述反馈信号,按照所述运维权限由低至高的顺序依次向其他所述被控设备终端发送所述告警信息。可选的,所述被控设备终端安装有运维客户端应用程序;或者,所述被控设备终端被配置有运维应用进程,以收集所属厂区的运维数据。可选的,新接入所述运维管理平台的所述被控设备终端被进一步配置为:向所述运维管理平台发送系统类型信息;所述运维管理平台被进一步配置为:根据所述系统类型信息获取客户端应用程序安装包,以及将所述安装包发送给新接入的所述被控设备终端;或者,根据所述系统类型信息获取运维程序进程,以及将所述运维程序进程发送给新接入的所述被控设备终端。可选的,所述运维管理平台被进一步配置为:按照各个厂区范围预设接收的数据类型;以及根据所述数据类型向所述被控设备终端发送数据接收指令;所述被控设备终端被进一步配置为:获取所述运维管理平台发送的数据接收指令,根据所述数据接收指令筛选所述运维数据;以及,将筛选后的所述运维数据发送至所述运维管理平台。可选的,如果所述运维管理平台未接收到环境日志,与所述被控设备终端相匹配的所述环境监测器被进一步配置为:向所属厂区范围内的其他被控设备终端发送所述环境监测数据;所属厂区范围内的其他被控设备终端被配置为:根据所述环境监测数据生成环境日志,以及将所述环境日志发送给所述运维管理平台。可选的,其特征在于,所述环境监测器被进一步配置为:从所述运维管理平台获取所属厂区范围内的所有被控设备终端的负载信息;以及遍历所述负载信息,并将所述环境监测数据发送给负载最小的所述被控设备终端。可选的,所述运维管理平台为基于zabbix开源技术搭建的云服务平台;所述环境监测器通过SNMP协议将所述环境监测数据发送至所述运维管理平台。由以上技术方案可知,本申请提供一种基于机房运维管理平台的告警系统,包括运维管理平台、被控设备终端以及环境监测器。其中,环境监测器可采集所属厂区范围内的环境监测数据,并向运维管理平台和被控设备终端发送环境监测数据。被控设备终端可根据环境监测数据建立环境日志,并将环境日志发送至运维管理平台。运维管理平台可以定期从被控设备终端接收环境日志;如果未接收到环境日志,从被控设备终端相匹配的环境监测器接收环境监测数据;以及根据环境日志或环境监测数据生成告警信息。所述告警系统可以未接收到环境日志时,通过环境监测器获取环境监测数据,从而判断是否存在技术异常,以提高告警的时效性。附图说明为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请一种基于机房运维管理平台的告警系统结构示意图;图2为本申请一种基于机房运维管理平台的告警系统运行流程示意图;图3为本申请根据数据接收指令筛选运维数据的流程示意图;图4为本申请根据环境监测数据生成环境日志的流程示意图:图5为本申请被控设备终端的连接结构示意图。具体实施方式下面将详细地对实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下实施例中描述的实施方式并不代表与本申请相一致的所有实施方式。仅是与权利要求书中所详述的、本申请的一些方面相一致的系统和方法的示例。参见图1,为本申请一种基于机房运维管理平台的告警系统结构示意图。参见图2,为本申请一种基于机房运维管理平台本文档来自技高网...

【技术保护点】
1.一种基于机房运维管理平台的告警系统,包括:运维管理平台和多个被控设备;多个所述被控设备分别布置在多个厂区范围内,以收集所属厂区的运维数据;多个所述被控设备与运维管理平台建立通信连接,以将收集到的所述运维数据发送至所述运维管理平台,其特征在于,还包括设置在各厂区范围内的多个环境监测器;多个所述环境监测器与所述运维管理平台建立通信连接;/n所述环境监测器被配置为采集所属厂区范围内的环境监测数据,所述环境监测数据包括温度信息、湿度信息以及网络状况信息中的至少一种信息;以及向所述运维管理平台发送所述环境监测数据;/n所述被控设备被配置为接收所述环境监测数据,以及根据所述环境监测数据建立环境日志,并将所述环境日志发送至所述运维管理平台;/n所述运维管理平台被配置为定期从所述被控设备接收所述环境日志;如果未接收到所述环境日志,从所述被控设备相匹配的所述环境监测器接收所述环境监测数据;以及根据所述环境日志或所述环境监测数据生成告警信息。/n

【技术特征摘要】
1.一种基于机房运维管理平台的告警系统,包括:运维管理平台和多个被控设备;多个所述被控设备分别布置在多个厂区范围内,以收集所属厂区的运维数据;多个所述被控设备与运维管理平台建立通信连接,以将收集到的所述运维数据发送至所述运维管理平台,其特征在于,还包括设置在各厂区范围内的多个环境监测器;多个所述环境监测器与所述运维管理平台建立通信连接;
所述环境监测器被配置为采集所属厂区范围内的环境监测数据,所述环境监测数据包括温度信息、湿度信息以及网络状况信息中的至少一种信息;以及向所述运维管理平台发送所述环境监测数据;
所述被控设备被配置为接收所述环境监测数据,以及根据所述环境监测数据建立环境日志,并将所述环境日志发送至所述运维管理平台;
所述运维管理平台被配置为定期从所述被控设备接收所述环境日志;如果未接收到所述环境日志,从所述被控设备相匹配的所述环境监测器接收所述环境监测数据;以及根据所述环境日志或所述环境监测数据生成告警信息。


2.根据权利要求1所述的基于机房运维管理平台的告警系统,其特征在于,所述告警系统还包括多个被控设备终端,多个所述被控设备终端被预先设置为多个运维权限;
所述运维管理平台被进一步配置为:获取所述告警信息对应的所述被控设备的管理权限,匹配所述运维权限高于所述管理权限的所述被控设备终端;以及向匹配的所述被控设备终端发送所述告警信息。


3.根据权利要求2所述的基于机房运维管理平台的告警系统,其特征在于,在向匹配的所述被控设备终端发送所述告警信息的步骤中,所述运维管理平台被进一步配置为:
遍历多个匹配到的所述被控设备终端的运维权限;以及,优先向运维权限低的所述被控设备终端发送所述告警信息。


4.根据权利要求3所述的基于机房运维管理平台的告警系统,其特征在于,所述被控设备终端被配置为:获取处理动作信息,以及根据所述处理动作信息生成反馈信号,并将所述反馈信号发送给所述运维管理平台;
所述运维管理平台被进一步配置为接收所述被控设备终端的反馈信号;以及,如果在预设处理时间内未接收到所述反馈信号,按照所述运维权限由低至高的顺序依次向其他所述被控设备终端发送...

【专利技术属性】
技术研发人员:李福存王苏扬任国庆陈传浩张远兆潘世祥周涵冯昌邮李楠楠汪联欢
申请(专利权)人:南京天芯云数据服务有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1