一种故障处理系统、方法、设备和存储介质技术方案

技术编号:30171932 阅读:20 留言:0更新日期:2021-09-25 15:30
本发明专利技术实施例公开了一种故障处理系统、方法、设备及存储介质,该系统包括:告警子系统,用于接收告警平台发送的故障告警信息;匹配子系统,用于将接收的故障告警信息与预先存储的各策略信息进行匹配;各策略信息包含告警描述信息与自愈任务标识的对应关系;决策子系统,用于在匹配子系统匹配成功时获取预先针对当前应用系统设置的自愈参数,根据自愈参数确定自愈策略,根据自愈策略确定是否向执行子系统发送包含匹配成功的策略信息中的自愈任务标识的自愈任务执行指令;执行子系统,用于在接收到自愈任务执行指令时执行自愈任务标识对应的自愈任务。本发明专利技术实施例使得故障处理系统快速定位故障、灵活确定自愈策略、提高故障处理效率。理效率。理效率。

【技术实现步骤摘要】
一种故障处理系统、方法、设备和存储介质


[0001]本专利技术实施例涉及计算机
,尤其涉及一种故障处理系统、方法、设备和存储介质。

技术介绍

[0002]随着计算机技术的发展,金融领域的业务模式快速生长,应用系统的数量和技术栈类型也越来越多。同时,由于金融行业的稳定性、实时性特点,监管部门对于7*24小时故障处置的时限要求也越来越高。
[0003]目前,大部分故障处置及排查仍基于运维人员的经验,导致故障处置的主观性大、故障处理效率低。此外,高强度的运维压力、低时限的故障处置恢复要求、琳琅满目的IT技术栈(网络、操作系统、数据库、中间件、应用等),对于运维人员的心理、体力、脑力,都带来了巨大的考验。

技术实现思路

[0004]本专利技术实施例提供一种故障处理系统、方法、设备和存储介质,以提高故障定位速度、灵活确定自愈策略、提高故障处理效率。
[0005]第一方面,本专利技术实施例提供了一种故障处理系统,包括:告警子系统、匹配子系统、决策子系统、以及执行子系统;其中:
[0006]所述告警子系统,用于接收告警平台发送的故障告警信息;
[0007]所述匹配子系统,用于将接收的故障告警信息与预先存储的各策略信息进行匹配;其中,各所述策略信息包含告警描述信息与自愈任务标识的对应关系;
[0008]所述决策子系统,用于在所述匹配子系统匹配成功时,获取预先针对当前应用系统设置的自愈参数,根据所述自愈参数确定自愈策略,根据所述自愈策略确定是否向所述执行子系统发送包含匹配成功的策略信息中的自愈任务标识的自愈任务执行指令;
[0009]所述执行子系统,用于在接收到所述自愈任务执行指令时执行所述自愈任务标识对应的自愈任务。
[0010]第二方面,本专利技术实施例提供了一种故障处理方法,包括:
[0011]经由告警子系统接收告警平台发送的故障告警信息;
[0012]经由匹配子系统将接收的故障告警信息与预先存储的各策略信息进行匹配;其中,各所述策略信息包含告警描述信息与自愈任务标识的对应关系;
[0013]经由决策子系统在所述匹配子系统匹配成功时,获取预先针对当前应用系统设置的自愈参数,根据所述自愈参数确定自愈策略,根据所述自愈策略确定是否向执行子系统发送包含匹配成功的策略信息中的自愈任务标识的自愈任务执行指令;
[0014]经由所述执行子系统在接收到所述自愈任务执行指令时执行所述自愈任务标识对应的自愈任务。
[0015]第三方面,本专利技术实施例提供了一种电子设备,包括
[0016]一个或多个处理器;
[0017]存储装置,用于存储一个或多个程序;
[0018]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术实施例所述的故障处理方法。
[0019]第四方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术实施例所述的故障处理方法。
[0020]上述专利技术中的实施例具有如下优点或有益效果:
[0021]本专利技术实施例提供的方案中,预先存储包含告警描述信息与自愈任务标识的对应关系的各策略信息,在接收告警平台发送的故障告警信息时,将接收的故障告警信息与各策略信息进行匹配,若匹配成功则获取预先针对当前应用系统设置的自愈参数并根据自愈参数确定自愈策略,根据自愈策略确定是否向执行子系统发送包含匹配成功的策略信息中的自愈任务标识的自愈任务执行指令;执行子系统在接收到自愈任务执行指令时执行自愈任务标识对应的自愈任务。本方案将故障告警信息与各策略信息进行匹配可以避免人工排查故障,提高故障定位速度及故障处理效率,根据自愈参数确定自愈策略可以提高自愈策略的准确性和灵活性。
附图说明
[0022]图1是本专利技术实施例一中的一种故障处理系统的结构示意图;
[0023]图2是本专利技术实施例二中的一种故障处理系统的结构示意图;
[0024]图3是本专利技术实施例三中的一种故障处理方法的流程图;
[0025]图4是本专利技术实施例四中的一种故障处理装置的结构示意图;
[0026]图5是本专利技术实施例五中的一种电子设备的结构示意图;
具体实施方式
[0027]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0028]另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。
[0029]实施例一
[0030]图1是本专利技术实施例一中的一种故障处理系统的结构示意图,本专利技术实施例可以适用于金融等领域的应用系统故障定位等场景,如图1所示,本专利技术实施例提供的一种故障处理系统包括告警子系统110、匹配子系统120、决策子系统130、以及执行子系统140。
[0031]其中,告警子系统110,用于接收告警平台发送的故障告警信息;匹配子系统120,用于将接收的故障告警信息与预先存储的各策略信息进行匹配;决策子系统130,用于在匹配子系统120匹配成功时,获取预先针对当前应用系统设置的自愈参数,根据自愈参数确定
自愈策略,根据自愈策略确定是否向执行子系统140发送包含匹配成功的策略信息中的自愈任务标识的自愈任务执行指令;执行子系统140,用于在接收到自愈任务执行指令时执行自愈任务标识对应的自愈任务。
[0032]具体的,故障告警信息可以理解为应用系统可能发生的任意一种和/或任意多种类型的故障事件,在实际应用中多种故障源均可以导致故障事件。具体的故障告警信息对应的故障源的类型可以包括以下任意一种:网络类型、主机类型、数据库类型、中间件类型以及应用类型。其中,网络类型的故障告警信息可以包括网络中断、网络丢包等;主机类型的故障告警信息可以包括服务器磁盘空间不足、cluster集群功能故障等;数据库类型的故障告警信息可以为数据库严重关键字错误;中间件类型的故障告警信息可以包括内存溢出故障、服务器状态未知(server status unknown)等;应用类型的故障告警信息可以包括应用进程down、应用程序hang、应用交易量突增/突降、应用交易耗时高、应用交易成功率低、应用日志错误等。
[0033]在实际应用中,通过设置告警源监控各应用系统以便各应用系统出现故障事件时可以及时获取相应的故障告警信息。针对不同的告警源,可以建立统一的告警平台并根据预设间隔时间定时采集告警源发送的故障告警信息,继而将所有故障告警信息集合至告警平台以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障处理系统,其特征在于,所述系统包括:告警子系统、匹配子系统、决策子系统、以及执行子系统;其中:所述告警子系统,用于接收告警平台发送的故障告警信息;所述匹配子系统,用于将接收的故障告警信息与预先存储的各策略信息进行匹配;其中,各所述策略信息包含告警描述信息与自愈任务标识的对应关系;所述决策子系统,用于在所述匹配子系统匹配成功时,获取预先针对当前应用系统设置的自愈参数,根据所述自愈参数确定自愈策略,根据所述自愈策略确定是否向所述执行子系统发送包含匹配成功的策略信息中的自愈任务标识的自愈任务执行指令;所述执行子系统,用于在接收到所述自愈任务执行指令时执行所述自愈任务标识对应的自愈任务。2.根据权利要求1所述的系统,其特征在于,所述决策子系统具体用于:若根据所述自愈参数确定的自愈策略为全自动执行策略,则向所述执行子系统发送包含匹配成功的策略信息中的自愈任务标识的自愈任务执行指令;若根据所述自愈参数确定的自愈策略为半自动执行策略,则向预设人员的通信账号发送通知消息,以使所述预设人员对是否执行自愈任务进行反馈;根据所述预设人员的反馈信息确定是否向所述执行子系统发送包含匹配成功的策略信息中的自愈任务标识的自愈任务执行指令。3.根据权利要求2所述的系统,其特征在于,所述半自动执行策略为半自动单人确认后执行策略或半自动多人确认后执行策略;所述决策子系统具体用于:若所述半自动执行策略为半自动单人确认后执行策略,则在至少一个所述预设人员的反馈信息包括确认执行信息并且反馈时间在预设的人员反馈时间段内时,确定向所述执行子系统发送包含匹配成功的策略信息中的自愈任务标识的自愈任务执行指令;若所述半自动执行策略为半自动多人确认后执行策略,则在每个所述预设人员的反馈信息均包括确认执行信息并且反馈时间均在所述人员反馈时间段内时,确定向所述执行子系统发送包含匹配成功的策略信息中的自愈任务标识的自愈任务执行指令。4.根据权利要求2所述的系统,其特征在于,所述决策子系统还用于:在确定所述自愈策略为半自动执行策略之后、并且向至少一个预设人员的通信账号发送通知消息之前,根据历史知识库确定匹配成功的策略信息对应的最近M次的历史任务执行信息;其中,M为不小于1的整数;若根据所述最近M次的历史任务执行信息确定最近M次均执行了所述自愈任务,则向所述执行子系统发送包含匹配成功的策略信息中的自愈任务标识的自愈任务执行指令,否则,触发执行向至少一个预设人员的通信账号发送通知消息的操作。5.根...

【专利技术属性】
技术研发人员:贺春玮张文超张佳伟刘宝山张俊范彦
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1