基于Prometheus的实时监控告警方法及系统技术方案

技术编号:34397716 阅读:49 留言:0更新日期:2022-08-03 21:33
本发明专利技术公开了基于Prometheus的实时监控告警方法及系统,属于监控技术领域,要解决的技术问题为如何使Prometheus的监控数据存储满足大规模监控的读写的并发需求。包括如下步骤:对于多个Prometheus,通过修改配置文件的方式远程写入转发程序;通过转发程序将监控数据实时发送至kafka集群,并将监控数据实时发送至Thanos、并存储至minio集群库;基于kafka集群推送的实时监控数据触发告警处理模块生成告警,将告警信息写入告警信息库并反馈至用户;告警处理模块定时采集存储于minio集群库的历史监控数据,基于时间段内的历史监控数据生成告警,将告警信息写入告警信息库并反馈至用户。用户。用户。

【技术实现步骤摘要】
基于Prometheus的实时监控告警方法及系统


[0001]本专利技术涉及监控
,具体地说是基于Prometheus的实时监控告警方法及系统。

技术介绍

[0002]Prometheus是一种开源的监控系统,是Google BorgMon(一种监控系统)的开源版本。伴随着容器及Kubernetes(简称K8s,用于管理云平台中多个主机上的容器化的应用)技术的兴起,Prometheus越来越受到大家的关注。
[0003]Thanos是一组通过跨集群联合、跨集群无限存储和全局查询为Prometheus增加高可用性的组件。
[0004]随着k8s集群规模的不断扩张以及Prometheus主动拉取采集方式,Prometheus在高并发场景的瓶颈越发突出,Prometheus本身的本地存储的模式和采集方式已然不能完全满足大规模监控的读写的并发需求。
[0005]基于上述分析,如何使Prometheus的监控数据存储满足大规模监控的读写的并发需求,保证Prometheus在大规模场景下的高可用性,是需要解决的技术问题。...

【技术保护点】

【技术特征摘要】
1.基于Prometheus的实时监控告警方法,其特征在于包括如下步骤:对于多个Prometheus,通过修改配置文件的方式远程写入转发程序;对于多个Prometheus的监控数据,通过转发程序将所述监控数据实时发送至kafka集群作为实时监控数据,并将所述监控数据实时发送至Thanos、并存储至minio集群库作为历史监控数据;基于kafka集群推送的实时监控数据触发告警处理模块生成告警,将对应的告警信息写入告警信息库并反馈至用户;告警处理模块定时采集存储于minio集群库的历史监控数据,基于时间段内的历史监控数据生成告警,将对应的告警信息写入告警信息库并反馈至用户。2.根据权利要求1所述的基于Prometheus的实时监控告警方法,其特征在于对于多个Prometheus,通过修改配置文件增加远程写入地址以及唯一的集群名称,远程写入通过go语言开发的转发程序。3.根据权利要求2所述的基于Prometheus的实时监控告警方法,其特征在于所述转发程序解析多个Prometheus传输的数据包,通过配置文件重定向发送至kafka集群的接收路径以及Thanos的接收路径。4.根据权利要求1所述的基于Prometheus的实时监控告警方法,其特征在于所述Thanos包括receive组件和Query组件;通过Thanos的receive组件将监控数据存储至Minio集群库;Query组件通过Thanos store提供外部查询接口,并对监控数据中的重复数据进行去重处理。5.根据权利要求4所述的基于Prometheus的实时监控告警方法,其特征在于所述告警处理模块通过转发程序的定时任务定时调用Thanos的Query组件查询minio集群库中的历史监控数据,通过预先配置的告警规则对时间段内的监控数据进行告警匹配,如果符合告警规则生成告警,将所述告警对应的告警信息写入告警信息库并反馈至用户。6.根据权利要求1所述的基于Prometheus的实时监控告警方法,其特征在于基于告警处理模块订阅的主题,kafka集群将对应的实时监控数据主动推送至告警处理模块,告警处理模块基于预定的告警规则,对实时获取的实时监控数据进行告警匹配,将符合告警规则的对象生成实时告警,将所述实时告警对应的告警信息写入告警信息库并反馈至用户。7.根据权利要求1

6任一项所述的基于Prometheus的实时监控告警方法,其特征在于所述告警处...

【专利技术属性】
技术研发人员:王兆宁赵兵侯桂星
申请(专利权)人:浪潮通信信息系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1