故障监控方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34766880 阅读:57 留言:0更新日期:2022-08-31 19:19
本发明专利技术提供了一种故障监控方法、装置、电子设备及存储介质,所述监控方法首先根据预设规则对Prometheus监控系统中的告警信息进行状态标记;其中,所述状态标记包括Firing;然后获取所述Prometheus监控系统中处于Firing标记状态的告警信息存入日志文件中;最后为所述日志文件中的告警信息创建监控项和对应的触发器。本发明专利技术可以避免分散管理的同时避免告警事件不能及时处理或者遗漏的情况;可以实现多个监控系统的统一管理及统一告警、快速便捷获取告警信息、告警信息有效聚合、告警分级和提升运维工作效率。升运维工作效率。升运维工作效率。

【技术实现步骤摘要】
故障监控方法、装置、电子设备及存储介质


[0001]本专利技术涉及监控系统
,尤其涉及一种故障监控方法、装置、电子设备及存储介质。

技术介绍

[0002]当前主流的开源监控系统有Zabbix和Prometheus,不过这两个监控系统侧重点不一样,Prometheus主要是为容器而生的,对容器和k8s监控的天然集成,而Zabbix则是实现网络服务以及服务器、网络设备的监控。
[0003]现有技术的缺点:
[0004]Prometheus自带UI简单,虽然把Grafana作为Prometheus前端UI,但是在告警可视化方面不及Zabbix,报警功能也不如Zabbix那么灵活;
[0005]多套监控系统分散管理,降低了运维工作效率。

技术实现思路

[0006]本专利技术提供了一种故障监控方法、装置、电子设备及存储介质,可以避免分散管理的同时避免告警事件不能及时处理或者遗漏的情况;可以实现多个监控系统的统一管理及统一告警、快速便捷获取告警信息、告警信息有效聚合、告警分级和提升运维工作效率。
[0007]第一方面,本专利技术实施例提供了一种故障监控方法,所述监控方法包括:
[0008]根据预设规则对Prometheus监控系统中的告警信息进行状态标记;其中,所述状态标记包括Firing;
[0009]获取所述Prometheus监控系统中处于Firing标记状态的告警信息存入日志文件中;
[0010]为所述日志文件中的告警信息创建监控项和对应的触发器。
[0011]可选地,所述监控方法还包括:
[0012]当触发告警条件时,在Zabbix监控系统的前端页面展示告警信息,并按所述Zabbix监控系统的告警流程将所述告警信息通知到负责人。
[0013]可选地,所述监控方法还包括:
[0014]访问Prometheus webui的"Alerts"选项卡查看所述Prometheus监控系统中的告警信息的当前标记状态。
[0015]可选地,所述根据预设规则对Prometheus监控系统中的告警信息进行状态标记包括:将所述告警信息的状态标记为Inactive、Pending或Firing;
[0016]若server_load<=20,则将所述告警信息的状态标记为Inactive;
[0017]若server_load>20,且持续时间小于5分钟,则将所述告警信息的状态标记为Pending;
[0018]若server_load>20,且持续时间大于5分钟,则将所述告警信息的状态标记为Firing。
[0019]可选地于,所述根据预设规则对Prometheus监控系统中的告警信息进行状态标记还包括:
[0020]若server_load>100,所述告警信息的标记状态直接从Inactive标记状态转入Firing标记状态。
[0021]可选地,所述获取所述Prometheus监控系统中处于Firing标记状态的告警信息存入日志文件中包括:
[0022]根据预先编写的python脚本获取所述Prometheus监控系统中处于Firing标记状态的告警信息;
[0023]将所述告警信息以json格式存入到所述日志文件中。
[0024]第二方面,本专利技术的实施例提供了一种故障监控装置,所述监控装置包括:
[0025]状态标记模块,根据预设规则对Prometheus监控系统中的告警信息进行状态标记;其中,所述状态标记包括Firing;
[0026]数据获取模块,获取所述Prometheus监控系统中处于Firing标记状态的告警信息存入日志文件中;
[0027]监控模块,为所述日志文件中的告警信息创建监控项和对应的触发器。
[0028]可选地,所述监控装置还包括:
[0029]展示及通知模块,当触发告警条件时,在Zabbix监控系统的前端页面展示告警信息,并按所述Zabbix监控系统的告警流程将所述告警信息通知到负责人。
[0030]第三方面,本专利技术的实施例提供了一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如第一方面任一项所述的方法。
[0031]第四方面,本专利技术的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项所述的方法。
[0032]有益效果
[0033]本专利技术提供了一种故障监控方法、装置、电子设备及存储介质,所述监控方法首先根据预设规则对Prometheus监控系统中的告警信息进行状态标记;其中,所述状态标记包括Firing;然后获取所述Prometheus监控系统中处于Firing标记状态的告警信息存入日志文件中;最后为所述日志文件中的告警信息创建监控项和对应的触发器。本专利技术可以避免分散管理的同时避免告警事件不能及时处理或者遗漏的情况;可以实现多个监控系统的统一管理及统一告警、快速便捷获取告警信息、告警信息有效聚合、告警分级和提升运维工作效率。
[0034]应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本专利技术的实施例的关键或重要特征,亦非用于限制本专利技术的范围。本专利技术的其它特征将通过以下的描述变得容易理解。
附图说明
[0035]结合附图并参考以下详细说明,本专利技术各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素。
[0036]图1示出了本专利技术的实施例的一种故障监控方法的流程图;
[0037]图2示出了本专利技术的另一实施例的一种故障监控方法的流程图;
[0038]图3示出了本专利技术实施例的一种故障监控装置的结构示意图;
[0039]图4示出了本专利技术另一实施例的一种故障监控装置的结构示意图;
[0040]图5示出了本专利技术实施例的一种电子设备的结构图。
具体实施方式
[0041]为了使本
的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
[0042]需要说明的是,本专利技术实施例描述的仅仅是为了更加清楚的说明本专利技术实施例的技术方案,并不构成对本专利技术实施例提供的技术方案的限定。
[0043]图1示出了本专利技术的实施例的一种故障监控方法的流程图;参见图1,所述监控方法包括:
[0044]S20、根据预设规则对Prometheus监控系统中的告警信息进行状态标记;其中,所述状态标记包括Firing;
[0045]具体地本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障监控方法,其特征在于,所述监控方法包括:根据预设规则对Prometheus监控系统中的告警信息进行状态标记;其中,所述状态标记包括Firing;获取所述Prometheus监控系统中处于Firing标记状态的告警信息存入日志文件中;为所述日志文件中的告警信息创建监控项和对应的触发器。2.根据权利要求1所述的监控方法,其特征在于,所述监控方法还包括:当触发告警条件时,在Zabbix监控系统的前端页面展示告警信息,并按所述Zabbix监控系统的告警流程将所述告警信息通知到负责人。3.根据权利要求1所述的监控方法,其特征在于,所述监控方法还包括:访问Prometheus webui的"Alerts"选项卡查看所述Prometheus监控系统中的告警信息的当前标记状态。4.根据权利要求1所述的监控方法,其特征在于,所述根据预设规则对Prometheus监控系统中的告警信息进行状态标记包括:将所述告警信息的状态标记为Inactive、Pending或Firing;若server_load<=20,则将所述告警信息的状态标记为Inacti ve;若server_load>20,且持续时间小于5分钟,则将所述告警信息的状态标记为Pending;若server_load>20,且持续时间大于5分钟,则将所述告警信息的状态标记为Firing。5.根据权利要求3所述的监控方法,其特征在于,所述根据预设规则对Prometheus监控系统中...

【专利技术属性】
技术研发人员:周健何明柯细兴罗洪滨
申请(专利权)人:亿玛创新网络天津有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1