故障告警处理方法、系统及计算机可读存储介质技术方案

技术编号:19751159 阅读:27 留言:0更新日期:2018-12-12 05:44
本发明专利技术公开了一种故障告警处理方法,包括以下步骤:规则引擎接收监控平台输入的多维度故障告警信息;基于配置规则对所述故障告警信息进行逻辑判断,以确定本次告警的故障原因;基于所述故障原因,检索运维数据库,得到所述故障原因对应的故障处理方案。本发明专利技术还公开了一种故障告警处理系统及计算机可读存储介质。本发明专利技术提高了故障告警处理的时效性与准确性,增强了故障运维效率。

【技术实现步骤摘要】
故障告警处理方法、系统及计算机可读存储介质
本专利技术涉及故障运维
,尤其涉及一种故障告警处理方法、系统及计算机可读存储介质。
技术介绍
网络设备或应用发生故障通常都可以通过在线监控方式及时获得告警。当发生告警时,现有技术通常是直接提示存在故障,然后让运维人员前往检测确定故障原因并分析出故障排除方案后再排除故障,前前后后可能需要花费很长时间,进而时效性不高。
技术实现思路
本专利技术的主要目的在于提供一种故障告警处理方法、系统及计算机可读存储介质,旨在解决如何提高故障告警处理时效的技术问题。为实现上述目的,本专利技术提供一种故障告警处理方法,所述故障告警处理方法包括以下步骤:规则引擎接收监控平台输入的多维度故障告警信息;基于配置规则对所述故障告警信息进行逻辑判断,以确定本次告警的故障原因;基于所述故障原因,检索运维数据库,得到所述故障原因对应的故障处理方案。可选地,所述基于配置规则对所述故障告警信息进行逻辑判断,以确定本次告警的故障原因的步骤包括:将多维度的告警信息与配置规则进行比较,以在配置规则中查找与多维度的告警信息相同字段的信息;根据预设的信息与故障原因的映射关系,确定查找的所述信息对应的故障原因。可选地,在所述基于所述故障原因,检索运维数据库,得到所述故障原因对应的故障处理方案的步骤之后,所述故障告警处理方法包括:基于对应的自动处理方案自动化处理对应故障点,其中,自动化处理包括自动恢复故障点或自动隔离故障点。可选地,在故障原因是预设操作时,所述基于所述故障原因,检索运维数据库,得到所述故障原因对应的故障处理方案的步骤之后,所述故障告警处理方法包括:调用机器人对预设操作自动生成审批单,以将审批单发送至预设节点进行审批,并在审批完成后自动执行所述审批单对应的操作过程。可选地,在所述基于所述故障原因,检索运维数据库,得到所述故障原因对应的故障处理方案的步骤之后,所述故障告警处理方法还包括:根据所述故障告警信息、所述故障原因以及所述故障处理方案,生成本次告警的不同通知话术;调用机器人将所述通知话术分别推送至对应的合作方与运维方各自所在的通知群。可选地,在所述调用机器人将所述通知话术分别推送至对应的合作方与运维方各自所在的通知群的步骤之后,所述故障告警处理方法还包括:在故障恢复期间,所述规则引擎缓存相同的故障告警信息;生成故障恢复进展通知,并每隔预设时长将所述故障恢复进展通知推送至对应的合作方所在的通知群。可选地,所述故障告警处理方法还包括:在接收监控平台输入的多维度故障告警信息时,所述规则引擎还从指定的告警平台拉取与本次告警相关联的告警源的所有应用类告警信息,以供精确定位本次告警的故障原因。可选地,在所述规则引擎接收监控平台输入的多维度故障告警信息的步骤之前,所述故障告警处理方法还包括:所述监控平台收集多种告警源上报的故障告警信息以进行关联告警,其中,所述告警源类型包括:主机、网络、数据库、平台、应用程序;基于预设的阈值判断规则,将高于预设阈值的故障告警信息输入所述规则引擎。进一步地,为实现上述目的,本专利技术还提供一种故障告警处理系统,所述故障告警处理系统包括:监控平台,用于向规则引擎输入多维度故障告警信息;规则引擎,用于基于配置规则对所述故障告警信息进行逻辑判断,以确定本次告警的故障原因;基于所述故障原因,检索运维数据库,得到所述故障原因对应的故障处理方案。可选地,所述规则引擎还用于:基于对应的自动处理方案自动化处理对应故障点,其中,自动化处理包括自动恢复故障点或自动隔离故障点。可选地,在故障原因是预设操作时,所述规则引擎还用于:调用机器人对预设操作自动生成审批单,以将审批单发送至预设节点进行审批,并在审批完成后自动执行所述审批单对应的操作过程。可选地,所述规则引擎还用于:根据所述故障告警信息、所述故障原因以及所述故障处理方案,生成本次告警的不同通知话术;调用机器人将所述通知话术分别推送至对应的合作方与运维方各自所在的通知群。可选地,所述规则引擎还用于:在故障恢复期间,缓存相同的故障告警信息;生成故障恢复进展通知,并每隔预设时长将所述故障恢复进展通知推送至对应的合作方所在的通知群。可选地,所述规则引擎还用于:在接收监控平台输入的多维度故障告警信息时,还从指定的告警平台拉取与本次告警相关联的告警源的所有应用类告警信息,以供精确定位本次告警的故障原因。可选地,所述监控平台还用于:收集多种告警源上报的故障告警信息以进行关联告警,其中,所述告警源类型包括:主机、网络、数据库、平台、应用程序;基于预设的阈值判断规则,将高于预设阈值的故障告警信息输入所述规则引擎。可选地,所述故障告警处理系统还包括:机器人,用于在接收到所述规则引擎的调用请求时,将所述规则引擎输出的所述通知话术分别推送至对应的合作方与运维方各自所在的通知群。进一步地,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有故障告警处理程序,所述故障告警处理程序被处理器执行时实现如上述任一项所述的故障告警处理方法的步骤。本专利技术将多种告警源输出的多个维度的故障告警信息输入规则引擎中进行一系列复杂的逻辑判断,进而实现故障原因的快速运算,提高故障处理的时效性。本专利技术还能在告警的同时,进一步自动检索出对应的故障处理方案,进而从整体上提高了告警的时效性,缩短了故障定位时间。附图说明图1为本专利技术故障告警处理方法第一实施例的流程示意图;图2为本专利技术故障告警处理方法第二实施例的流程示意图;图3为本专利技术故障告警处理方法第三实施例的流程示意图;图4为本专利技术故障告警处理方法第四实施例的流程示意图;图5为本专利技术故障告警处理系统第一实施例的功能模块示意图;图6为本专利技术故障告警处理系统第二实施例的功能模块示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。本专利技术提供一种故障告警处理方法。参照图1,图1为本专利技术故障告警处理方法第一实施例的流程示意图。本实施例中,所述故障告警处理方法包括以下步骤:步骤S10,规则引擎接收监控平台输入的多维度故障告警信息;本实施例中,规则引擎可基于内置的规则对输入的参数进行逻辑判断并输出判断结果。可选使用experian规则引擎定义函数,编写脚本,创建用于故障告警信息综合运算规则,进而可对多维度故障告警信息进行逻辑判断。本实施例对于监控平台的具体设置不限,可选为基于Falcon框架进行二次开发和配置所生成的监控平台,该监控平台可以收集多种告警信息并实现秒级告警。为实现对告警故障原因的准确判断,本实施例中优选通过多种维度的故障告警信息进行全故障告警分析。多个维度体现在,通过监控平台收集主机、网络、数据库、平台以及各种应用程序上产生的告警信息,从而覆盖所有可能的故障原因,提升故障告警分析的准确性,进而节省告警分析事件,提高告警处理时效。进一步可选的,为丰富告警源信息,进而使规则引擎拥有更全面信息定位故障根源,因此,在接收监控平台输入的多维度故障告警信息时,规则引擎还从指定的告警平台拉取与本次告警相关联的告警源的所有应用类告警信息,以供精确定位本次告警的故障原因。其中,从指定的告警平台拉取与本次告警相关联的告警源的所有应用本文档来自技高网...

【技术保护点】
1.一种故障告警处理方法,其特征在于,所述故障告警处理方法包括以下步骤:规则引擎接收监控平台输入的多维度故障告警信息;基于配置规则对所述故障告警信息进行逻辑判断,以确定本次告警的故障原因;基于所述故障原因,检索运维数据库,得到所述故障原因对应的故障处理方案。

【技术特征摘要】
1.一种故障告警处理方法,其特征在于,所述故障告警处理方法包括以下步骤:规则引擎接收监控平台输入的多维度故障告警信息;基于配置规则对所述故障告警信息进行逻辑判断,以确定本次告警的故障原因;基于所述故障原因,检索运维数据库,得到所述故障原因对应的故障处理方案。2.如权利要求1所述的故障告警处理方法,其特征在于,所述基于配置规则对所述故障告警信息进行逻辑判断,以确定本次告警的故障原因的步骤包括:将多维度的告警信息与配置规则进行比较,以在配置规则中查找与多维度的告警信息相同字段的信息;根据预设的信息与故障原因的映射关系,确定查找的所述信息对应的故障原因。3.如权利要求1所述的故障告警处理方法,其特征在于,在所述基于所述故障原因,检索运维数据库,得到所述故障原因对应的故障处理方案的步骤之后,所述故障告警处理方法包括:基于对应的自动处理方案自动化处理对应故障点,其中,自动化处理包括自动恢复故障点或自动隔离故障点。4.如权利要求1所述的故障告警处理方法,其特征在于,在故障原因是预设操作时,所述基于所述故障原因,检索运维数据库,得到所述故障原因对应的故障处理方案的步骤之后,所述故障告警处理方法包括:调用机器人对预设操作自动生成审批单,以将审批单发送至预设节点进行审批,并在审批完成后自动执行所述审批单对应的操作过程。5.如权利要求1所述的故障告警处理方法,其特征在于,在所述基于所述故障原因,检索运维数据库,得到所述故障原因对应的故障处理方案的步骤之后,所述故障告警处理方法还包括:根据所述故障告警信息、所述故障原因以及所述故障处理方案,生成本次告警的不同通知话术;调用机器人将所述通知话术分别推送至对应的合作方与运维方各自所在的通知群。6.如权利要求5所述的故障告警处理方法,其特征在于,在所述调用机器人将所述通知话术分别推送至对应的合作方与运维方各自所在的通知群的步骤之后,所述故障告警处理方法还包括:在故障恢复期间...

【专利技术属性】
技术研发人员:程志峰卢道和周杰谢波胡盼盼杨俊杰饶俊明龚洵峰李云龙朱敏毅汪小苗孟凡震汪晓雪周琪
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1