监控预警系统及方法技术方案

技术编号:38819182 阅读:21 留言:0更新日期:2023-09-15 19:58
本发明专利技术提供了一种监控预警系统及方法,涉及监控技术领域,其中监控预警系统包括顺次连接的指标数据采集器、Prometheus监控器和告警管理器;指标数据采集器用于采集待监控服务多维度的指标数据,并将指标数据发送至Prometheus监控器;Prometheus监控器用于对指标数据进行异常分析,并当确定触发预设的告警规则时,发送告警通知至告警管理器;告警管理器用于基于预设的告警配置信息,下发告警通知。这样可以实现RocketMQ指标多维度监控,及时发现异常服务指标,从而早发现早治理,避免灾难升级。灾难升级。灾难升级。

【技术实现步骤摘要】
监控预警系统及方法


[0001]本专利技术涉及监控
,尤其是涉及一种监控预警系统及方法。

技术介绍

[0002]RocketMQ作为一款纯java、分布式、队列模型的开源消息中间件,支持事务消息、顺序消息、批量消息、定时消息、消息回溯等。主要功能是异步解耦和流量削峰。RocketMQ中间件对于系统功能流转至关重要,然而对于一些服务异常情况,不能提前感知。

技术实现思路

[0003]本专利技术的目的在于提供一种监控预警系统及方法,以及时发现异常服务指标。
[0004]第一方面,本专利技术实施例提供了一种监控预警系统,包括顺次连接的指标数据采集器、Prometheus监控器和告警管理器;
[0005]所述指标数据采集器用于采集待监控服务多维度的指标数据,并将所述指标数据发送至所述Prometheus监控器;
[0006]所述Prometheus监控器用于对所述指标数据进行异常分析,并当确定触发预设的告警规则时,发送告警通知至所述告警管理器;
[0007]所述告警管理器用于基于预设的告警配置信息,下发所述告警通知。
[0008]进一步地,所述指标数据采集器包括RocketMQ

exporter。
[0009]进一步地,所述RocketMQ

exporter的GitHub地址为:
[0010]https://github.com/apache/RocketMQ

exporter.git;<br/>[0011]所述RocketMQ

exporter的application.yml配置文件中的配置信息包括:指定的RocketMQ版本和nameserver地址,以及数据暴露端口注册中心接收到服务实例下线通知时,将服务实例下线通知信息发送到拉取方客户端监听端口;
[0012]所述RocketMQ

exporter启动成功后,访问的地址为:ip:5557/metrics。
[0013]进一步地,所述Prometheus监控器的prometheus.yml配置文件中的配置信息包括:所述RocketMQ

exporter的服务地址和所述RocketMQ

exporter的监听配置数据源。
[0014]进一步地,所述监控预警系统还包括与所述告警管理器连接的通知适配器;所述告警管理器具体用于基于所述告警配置信息,判断是否下发所述告警通知,以及当确定下发所述告警通知时,将所述告警通知的通知内容发送至所述通知适配器;所述通知适配器用于将所述通知内容发送至用户的接收工具。
[0015]进一步地,所述告警管理器的alertmanager.yml配置文件中的配置信息包括:添加的webhook以及所述通知适配器的服务地址。
[0016]进一步地,所述通知适配器的webhook

adapter配置文件中的配置信息包括:配置通知地址。
[0017]进一步地,所述Prometheus监控器的监控端口为所述告警管理器的IP地址和端口。
[0018]第二方面,本专利技术实施例还提供了一种监控预警方法,应用于第一方面所述的监控预警系统;所述监控预警方法包括:
[0019]所述指标数据采集器采集待监控服务多维度的指标数据,并将所述指标数据发送至所述Prometheus监控器;
[0020]所述Prometheus监控器对所述指标数据进行异常分析,并当确定触发预设的告警规则时,发送告警通知至所述告警管理器;
[0021]所述告警管理器基于预设的告警配置信息,下发所述告警通知。
[0022]进一步地,所述监控预警系统还包括与所述告警管理器连接的通知适配器;所述告警管理器基于预设的告警配置信息,下发所述告警通知,包括:
[0023]所述告警管理器基于所述告警配置信息,判断是否下发所述告警通知,以及当确定下发所述告警通知时,将所述告警通知的通知内容发送至所述通知适配器;
[0024]所述通知适配器将所述通知内容发送至用户的接收工具。
[0025]本专利技术实施例提供的监控预警系统及方法中,监控预警系统包括顺次连接的指标数据采集器、Prometheus监控器和告警管理器;指标数据采集器用于采集待监控服务多维度的指标数据,并将指标数据发送至Prometheus监控器;Prometheus监控器用于对指标数据进行异常分析,并当确定触发预设的告警规则时,发送告警通知至告警管理器;告警管理器用于基于预设的告警配置信息,下发告警通知。这样可以实现RocketMQ指标多维度监控,及时发现异常服务指标,从而早发现早治理,避免灾难升级。
附图说明
[0026]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0027]图1为本专利技术实施例提供的一种监控预警系统的结构示意图;
[0028]图2为本专利技术实施例提供的另一种监控预警系统的结构示意图;
[0029]图3为本专利技术实施例提供的一种监控预警方法的流程示意图;
[0030]图4为本专利技术实施例提供的另一种监控预警方法的流程示意图。
[0031]图标:110

指标数据采集器;111

RocketMQ

exporter;120

Prometheus监控器;130

告警管理器;140

通知适配器。
具体实施方式
[0032]下面将结合实施例对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0033]目前RocketMQ中间件在出现如下异常情况时,不能提前感知异常,现希望能够及时接收到系统告警通知并及时处理如下异常:
[0034]‑
服务宕机;
[0035]‑
消费者下线;
[0036]‑
消息出现长时间或者大量堆积;
[0037]‑
磁盘使用率过高;
[0038]‑
CPU负载过高;
[0039]‑
内存使用率过高;
[0040]‑
死信队列积压。
[0041]RocketMQ官方提供的RocketMQ

Console将MQ监控功能做了隐藏,需要修改源码手动放开;其中,RocketMQ

Console是RocketMQ项目的扩本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种监控预警系统,其特征在于,包括顺次连接的指标数据采集器、Prometheus监控器和告警管理器;所述指标数据采集器用于采集待监控服务多维度的指标数据,并将所述指标数据发送至所述Prometheus监控器;所述Prometheus监控器用于对所述指标数据进行异常分析,并当确定触发预设的告警规则时,发送告警通知至所述告警管理器;所述告警管理器用于基于预设的告警配置信息,下发所述告警通知。2.根据权利要求1所述的监控预警系统,其特征在于,所述指标数据采集器包括RocketMQ

exporter。3.根据权利要求2所述的监控预警系统,其特征在于,所述RocketMQ

exporter的GitHub地址为:https://github.com/apache/RocketMQ

exporter.git;所述RocketMQ

exporter的application.yml配置文件中的配置信息包括:指定的RocketMQ版本和nameserver地址,以及数据暴露端口注册中心接收到服务实例下线通知时,将服务实例下线通知信息发送到拉取方客户端监听端口;所述RocketMQ

exporter启动成功后,访问的地址为:ip:5557/metrics。4.根据权利要求2所述的监控预警系统,其特征在于,所述Prometheus监控器的prometheus.yml配置文件中的配置信息包括:所述RocketMQ

exporter的服务地址和所述RocketMQ

exporter的监听配置数据源。5.根据权利要求1所述的监控预警系统...

【专利技术属性】
技术研发人员:刘子健
申请(专利权)人:北京合思信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1