一种告警事件处理方法技术

技术编号:39487062 阅读:6 留言:0更新日期:2023-11-24 11:07
本申请公开了一种告警事件处理方法

【技术实现步骤摘要】
一种告警事件处理方法、装置、设备及存储介质


[0001]本专利技术涉及智能告警领域,特别涉及一种告警事件处理方法

装置

设备及存储介质


技术介绍

[0002]目前的监控告警工作中,大部分工作仍让需要人工进行,并且通过人工进行不同单位之间的沟通,但是人工拨打电话流程需要发现告警

找人

查通讯录

打电话,这个过程中将告警事件描述清楚整体过程至少需要1至3分钟,同时告警依赖邮箱,短信等,告警通知反馈效率低;并且人工跟踪告警量平均每月
15000
条左右,告警事件数量较多,人工疲于跟进,同时人工介入故障修复由于效率较低,收到告警事件后平均需要
30
分钟进行处理,并且需要通过各类专业监控工具分析排除可疑点

但是目前的技术栈监控工具繁杂无法有效统一和进行业务关联,各类监控工具监控维度不同,告警分析排查就需要通过不同平台进行,缺乏统一视角

这样一来,告警历史数据无法有效利用,无法反哺生产进行稳定性提升,并且告警事件的流转与闭环通过
ITSM(IT Service Management

IT
服务管理
)
进行,与告警本身脱节,无法形成有效的关联性

因此,如何更加有效地进行告警事件的通知以及处理是本领域有待解决的问题


技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种告警事件处理方法

装置

设备及存储介质,可以整合现有的各个监控告警工具的数据,将各个工具以及对应的告警事件的情况以“健康度”展现给运维人员,可以使运维人员更加方便直观的进行管理,并且通过对告警事件的上述管理流程对告警事件的处理进行完整闭环

其具体方案如下:
[0004]第一方面,本申请提供了一种告警事件处理方法,包括:
[0005]获取预设监控告警工具得到的告警事件并整合所述告警事件,得到初始告警事件,根据预设健康度评级规则对所述初始告警事件进行评级,并根据评级结果判断是否需要对所述初始告警事件进行事件跟踪;
[0006]若需要进行事件跟踪,则根据所述初始告警事件生成目标告警事件,执行所述目标告警事件对应的事件操作,并对所述目标告警事件根据预设分组规则进行分组,生成若干所述目标告警事件对应的告警故障单;所述告警故障单用于存储待处理的所述目标告警事件和所述目标告警事件的相关信息;
[0007]对所述告警故障单中的所述目标告警事件进行分析,并将分析结果发送至所述预设监控告警工具对应的业务系统,以便所述业务系统根据所述分析结果进行调整

[0008]可选的,所述获取预设监控告警工具得到的告警事件并整合所述告警事件,包括:
[0009]获取若干所述预设监控告警工具得到的所述告警事件,利用
Spark
组件将所述告警事件统一保存至
HADOOP(
一个提供分布式存储和计算的开源软件框架
)
大数据组件和
/

ES(Elaticsearch
,一个开源的高扩展的分布式全文检索引擎
)
大数据组件,以得到所述初
始告警事件

[0010]可选的,所述根据预设健康度评级规则对所述初始告警事件进行评级,并根据评级结果判断是否需要对所述初始告警事件进行事件跟踪,包括:
[0011]获取所述预设监控告警工具监控的所述业务系统产生告警的历史基线和告警阈值,根据所述历史基线和所述告警阈值对所述业务系统的技术栈实例和上层业务系统进行健康度评级,以得到所述业务系统的运行健康评分;
[0012]根据所述运行健康评分判断是否需要对所述初始告警事件进行事件跟踪

[0013]可选的,所述若需要进行事件跟踪,则根据所述初始告警事件生成目标告警事件,包括:
[0014]若需要进行事件跟踪,则将所述初始告警事件合并至预先已生成的告警事件,以得到所述目标告警事件;
[0015]或,根据所述初始告警事件直接生成对应的目标告警事件

[0016]可选的,所述根据所述初始告警事件直接生成对应的目标告警事件之后,还包括:
[0017]生成所述目标告警事件对应的事件通知,通过邮件和
/
或企业微信将所述事件通知发送至第一用户,并通过预设智能机器人基于预设通知范围对第二用户进行与所述事件通知相关的电话通知,以及将所述事件通知放入
kafka
消息队列;所述预设通知范围根据
CMDB(Configuration Management Database
,配置管理数据库
)
资源管理系统进行划分

[0018]可选的,所述生成所述目标告警事件对应的事件通知之前,还包括:
[0019]监测所述业务系统的实时指标,从所述实时指标中筛选满足预设告警阈值条件的目标告警指标,并根据所述目标告警指标对所述目标告警事件进行降噪处理,根据处理后的所述目标告警事件生成所述目标告警事件对应的事件通知

[0020]可选的,所述对所述告警故障单中的所述目标告警事件进行分析,包括:
[0021]根据预设数据分类维度通过朴素贝叶斯算法对所述目标告警事件进行分类,并将所述目标告警事件对应的告警原因进行分类,以便根据所述目标告警事件和所述告警原因的分类结果对所述告警故障单中的所述目标告警事件进行分析

[0022]第二方面,本申请提供了一种告警事件处理装置,包括:
[0023]事件评级模块,用于获取预设监控告警工具得到的告警事件并整合所述告警事件,得到初始告警事件,根据预设健康度评级规则对所述初始告警事件进行评级,并根据评级结果判断是否需要对所述初始告警事件进行事件跟踪;
[0024]故障单生成模块,用于若需要进行事件跟踪,则根据所述初始告警事件生成目标告警事件,执行所述目标告警事件对应的事件操作,并对所述目标告警事件根据预设分组规则进行分组,生成若干所述目标告警事件对应的告警故障单;所述告警故障单用于存储待处理的所述目标告警事件和所述目标告警事件的相关信息;
[0025]事件分析模块,用于对所述告警故障单中的所述目标告警事件进行分析,并将分析结果发送至所述预设监控告警工具对应的业务系统,以便所述业务系统根据所述分析结果进行调整

[0026]第三方面,本申请提供了一种电子设备,所述电子设备包括处理器和存储器;其中,所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现前述的告警事件处理方法

[0027]第四方面,本申请提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种告警事件处理方法,其特征在于,包括:获取预设监控告警工具得到的告警事件并整合所述告警事件,得到初始告警事件,根据预设健康度评级规则对所述初始告警事件进行评级,并根据评级结果判断是否需要对所述初始告警事件进行事件跟踪;若需要进行事件跟踪,则根据所述初始告警事件生成目标告警事件,执行所述目标告警事件对应的事件操作,并对所述目标告警事件根据预设分组规则进行分组,生成若干所述目标告警事件对应的告警故障单;所述告警故障单用于存储待处理的所述目标告警事件和所述目标告警事件的相关信息;对所述告警故障单中的所述目标告警事件进行分析,并将分析结果发送至所述预设监控告警工具对应的业务系统,以便所述业务系统根据所述分析结果进行调整
。2.
根据权利要求1所述的告警事件处理方法,其特征在于,所述获取预设监控告警工具得到的告警事件并整合所述告警事件,包括:获取若干所述预设监控告警工具得到的所述告警事件,利用
Spark
组件将所述告警事件统一保存至
HADOOP
大数据组件和
/

ES
大数据组件,以得到所述初始告警事件
。3.
根据权利要求1所述的告警事件处理方法,其特征在于,所述根据预设健康度评级规则对所述初始告警事件进行评级,并根据评级结果判断是否需要对所述初始告警事件进行事件跟踪,包括:获取所述预设监控告警工具监控的所述业务系统产生告警的历史基线和告警阈值,根据所述历史基线和所述告警阈值对所述业务系统的技术栈实例和上层业务系统进行健康度评级,以得到所述业务系统的运行健康评分;根据所述运行健康评分判断是否需要对所述初始告警事件进行事件跟踪
。4.
根据权利要求1所述的告警事件处理方法,其特征在于,所述若需要进行事件跟踪,则根据所述初始告警事件生成目标告警事件,包括:若需要进行事件跟踪,则将所述初始告警事件合并至预先已生成的告警事件,以得到所述目标告警事件;或,根据所述初始告警事件直接生成对应的目标告警事件
。5.
根据权利要求4所述的告警事件处理方法,其特征在于,所述根据所述初始告警事件直接生成对应的目标告警事件之后,还包括:生成所述目标告警事件对应的事件通知,通过邮件和
/
或企业微信将所述事件通知发送至...

【专利技术属性】
技术研发人员:黄勇俞嘉敏
申请(专利权)人:中国大地财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1