【技术实现步骤摘要】
一种告警事件处理方法、装置、设备及存储介质
[0001]本专利技术涉及智能告警领域,特别涉及一种告警事件处理方法
、
装置
、
设备及存储介质
。
技术介绍
[0002]目前的监控告警工作中,大部分工作仍让需要人工进行,并且通过人工进行不同单位之间的沟通,但是人工拨打电话流程需要发现告警
、
找人
、
查通讯录
、
打电话,这个过程中将告警事件描述清楚整体过程至少需要1至3分钟,同时告警依赖邮箱,短信等,告警通知反馈效率低;并且人工跟踪告警量平均每月
15000
条左右,告警事件数量较多,人工疲于跟进,同时人工介入故障修复由于效率较低,收到告警事件后平均需要
30
分钟进行处理,并且需要通过各类专业监控工具分析排除可疑点
。
但是目前的技术栈监控工具繁杂无法有效统一和进行业务关联,各类监控工具监控维度不同,告警分析排查就需要通过不同平台进行,缺乏统一视角
。
这样一来,告警历史数据无法有效利用,无法反哺生产进行稳定性提升,并且告警事件的流转与闭环通过
ITSM(IT Service Management
,
IT
服务管理
)
进行,与告警本身脱节,无法形成有效的关联性
。
因此,如何更加有效地进行告警事件的通知以及处理是本领域有待解决的问题
。
技术实现思路
[0003]有鉴于此 ...
【技术保护点】
【技术特征摘要】
1.
一种告警事件处理方法,其特征在于,包括:获取预设监控告警工具得到的告警事件并整合所述告警事件,得到初始告警事件,根据预设健康度评级规则对所述初始告警事件进行评级,并根据评级结果判断是否需要对所述初始告警事件进行事件跟踪;若需要进行事件跟踪,则根据所述初始告警事件生成目标告警事件,执行所述目标告警事件对应的事件操作,并对所述目标告警事件根据预设分组规则进行分组,生成若干所述目标告警事件对应的告警故障单;所述告警故障单用于存储待处理的所述目标告警事件和所述目标告警事件的相关信息;对所述告警故障单中的所述目标告警事件进行分析,并将分析结果发送至所述预设监控告警工具对应的业务系统,以便所述业务系统根据所述分析结果进行调整
。2.
根据权利要求1所述的告警事件处理方法,其特征在于,所述获取预设监控告警工具得到的告警事件并整合所述告警事件,包括:获取若干所述预设监控告警工具得到的所述告警事件,利用
Spark
组件将所述告警事件统一保存至
HADOOP
大数据组件和
/
或
ES
大数据组件,以得到所述初始告警事件
。3.
根据权利要求1所述的告警事件处理方法,其特征在于,所述根据预设健康度评级规则对所述初始告警事件进行评级,并根据评级结果判断是否需要对所述初始告警事件进行事件跟踪,包括:获取所述预设监控告警工具监控的所述业务系统产生告警的历史基线和告警阈值,根据所述历史基线和所述告警阈值对所述业务系统的技术栈实例和上层业务系统进行健康度评级,以得到所述业务系统的运行健康评分;根据所述运行健康评分判断是否需要对所述初始告警事件进行事件跟踪
。4.
根据权利要求1所述的告警事件处理方法,其特征在于,所述若需要进行事件跟踪,则根据所述初始告警事件生成目标告警事件,包括:若需要进行事件跟踪,则将所述初始告警事件合并至预先已生成的告警事件,以得到所述目标告警事件;或,根据所述初始告警事件直接生成对应的目标告警事件
。5.
根据权利要求4所述的告警事件处理方法,其特征在于,所述根据所述初始告警事件直接生成对应的目标告警事件之后,还包括:生成所述目标告警事件对应的事件通知,通过邮件和
/
或企业微信将所述事件通知发送至...
【专利技术属性】
技术研发人员:黄勇,俞嘉敏,
申请(专利权)人:中国大地财产保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。