设备的故障修复方法及装置制造方法及图纸

技术编号:24205636 阅读:26 留言:0更新日期:2020-05-20 14:32
本发明专利技术提供了一种设备的故障修复方法及装置,该方法包括:当接收到机器资源监控数据时,确定机器资源监控数据对应的设备节点;获取设备节点对应的监控指标类型以及监控指标类型对应的指标阈值规则;在所述机器资源监控数据中获取与监控指标类型匹配的目标监控数据;将目标监控数据与阈值规则进行比对,以判断设备节点是否处于异常状态;若设备节点处于异常状态,则生成异常状态对应的告警事件,并判断告警事件是否满足预先设置的告警规则,若满足,则确定与告警事件对应的目标修复脚本;依据目标修复脚本生成作业指令,并将作业指令发送至所述设备节点,以触发设备节点依据所述作业指令执行修复操作。应用本发明专利技术的方法,能够快速修复设备的故障。

Methods and devices for repairing equipment faults

The invention provides a fault repair method and device of the device, the method includes: when receiving the machine resource monitoring data, determining the device node corresponding to the machine resource monitoring data; obtaining the monitoring indicator type corresponding to the device node and the indicator threshold rule corresponding to the monitoring indicator type; obtaining the matching indicator type in the machine resource monitoring data Target monitoring data: compare the target monitoring data with the threshold rule to determine whether the device node is in an abnormal state; if the device node is in an abnormal state, generate an alarm event corresponding to the abnormal state, and determine whether the alarm event meets the pre-set alarm rules; if so, determine the target repair script corresponding to the alarm event; repair according to the target The script generates a job instruction and sends the job instruction to the device node to trigger the device node to perform a repair operation according to the job instruction. The method of the invention can quickly repair the fault of the equipment.

【技术实现步骤摘要】
设备的故障修复方法及装置
本专利技术涉及计算机运维领域,特别涉及一种设备的故障修复方法及装置。
技术介绍
随着科学技术的发展,计算机设备的应用已经覆盖了我们生活的方方面面,计算机设备的出现是20世纪最卓越的成就之一,它的应用领域从最初的军事科研应用扩展到社会的各个领域,已形成了规模巨大的计算机产业,带动了全球范围的技术进步,到了今天,在我们生活的方方面面,都离不开了计算机设备以及相关的网络设备。计算机设备以及其关联的网络设备在运行过程中,总会出现故障,当出现故障时,需要快速排查故障以修复故障,避免故障时间过长而导致各种各样的损失。然而,由于设备系统的复杂性较高,往往难以快速找到故障的解决方案。
技术实现思路
本专利技术所要解决的技术问题是提供一种设备的故障修复方法,能够快速的修复设备的故障。本专利技术还提供了一种设备的故障修复装置,用以保证上述方法在实际中的实现及应用。一种设备的故障修复方法,包括:当接收到机器资源监控数据时,确定所述机器资源监控数据对应的设备节点;获取与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则;在所述机器资源监控数据中获取与所述监控指标类型匹配的目标监控数据;将所述目标监控数据与所述指标阈值规则进行比对,以判断所述设备节点是否处于异常状态;若所述设备节点处于异常状态,则生成所述异常状态对应的告警事件,并判断所述告警事件是否满足预先设置的告警规则;若满足,则确定与所述告警事件对应的目标修复脚本;依据所述目标修复脚本生成作业指令,并将所述作业指令发送至所述设备节点,以触发所述设备节点依据所述作业指令执行修复操作。上述的方法,可选的,所述获取与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则,包括:依据所述设备节点的设备节点标识遍历预先设置的配置文件,获得与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则。上述的方法,可选的,判断所述告警事件是否满足预先设置的告警规则包括:依据预先设置的告警白名单判断所述告警事件当前是否处于抑制状态;若所述告警事件未处于所述抑制状态,则获取所述设备节点在预设时段内对应的告警记录;判断所述告警记录中是否存在与所述告警事件相关联的历史告警事件;若存在,则判断所述告警事件与所述历史告警事件是否满足预先设置的聚合规则,若满足,则确定所述告警事件满足预先设置的告警规则;若不存在,则确定所述告警事件满足预先设置的告警规则。上述的方法,可选的,若所述告警事件与所述历史告警事件是否满足预先设置的聚合规则,则所述确定与所述告警事件对应的目标修复脚本,包括:将所述告警事件以及所述历史告警事件进行聚合操作,得到目标告警事件;依据所述目标告警事件在预先建立的脚本文件库中确定目标修复脚本。上述的方法,可选的,确定所述告警事件满足所述告警规则之后,还包括:判断所述告警事件是否满足预先设置的告警通知规则,若满足,则生成与所述告警事件对应的告警通知消息;确定与所述设备节点对应的告警接收组,将所述告警通知消息发送至所述告警接收组中的各个对象。上述的方法,可选的,所述依据所述目标修复脚本生成作业指令,包括:获取所述设备节点的IP地址信息以及所述设备节点所处的区域信息;调用预先设置的作业模板,对所述IP地址信息、所述区域信息以及所述目标修复脚本进行编排,得到所述设备节点对应的作业指令。一种设备的故障修复装置,包括:接收单元,用于当接收到机器资源监控数据时,确定所述机器资源监控数据对应的设备节点;第一获取单元,用于获取与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则;第二获取单元,用于在所述机器资源监控数据中获取与所述监控指标类型匹配的目标监控数据;比对单元,用于将所述目标监控数据与所述指标阈值规则进行比对,以判断所述设备节点是否处于异常状态;生成单元,用于若所述设备节点处于异常状态,则生成所述异常状态对应的告警事件,并判断所述告警事件是否满足预先设置的告警规则;确定单元,用于当所述告警事件满足所述告警规则时,确定与所述告警事件对应的目标修复脚本;修复单元,用于依据所述目标修复脚本生成作业指令,并将所述作业指令发送至所述设备节点,以触发所述设备节点依据所述作业指令执行修复操作。上述的装置,可选的,所述第一获取单元,包括:查询子单元,用于依据所述设备节点的设备节点标识遍历预先设置的配置文件,获得与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则。上述的装置,可选的,判断所述告警事件是否满足预先设置的告警规则的所述生成单元,包括:第一判断子单元,用于依据预先设置的告警白名单判断所述告警事件当前是否处于抑制状态;第一获取子单元,用于当所述告警事件未处于所述抑制状态时,获取所述设备节点在预设时段内对应的告警记录;第二判断子单元,用于判断所述告警记录中是否存在与所述告警事件相关联的历史告警事件;第一执行子单元,用于存在与所述告警事件关联的历史告警事件的情况下,则判断所述告警事件与所述历史告警事件是否满足预先设置的聚合规则,若满足,则确定所述告警事件满足所述告警规则;第二执行子单元,用于当不存在与所述告警事件相关联的历史告警事件时,确定所述告警事件满足所述告警规则。上述的装置,可选的,所述依据所述目标修复脚本生成作业指令的所述修复单元,包括:第二获取子单元,用于获取所述设备节点的IP地址信息以及所述设备节点所处的区域信息;生成子单元,用于调用预先设置的作业模板,对所述IP地址信息、所述区域信息以及所述目标修复脚本进行编排,得到所述设备节点对应的作业指令。与现有技术相比,本专利技术包括以下优点:本专利技术提供了一种设备的故障修复方法和装置,当接收到机器资源监控数据时,确定所述机器资源监控数据对应的设备节点;获取与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则;在所述机器资源监控数据中获取与所述监控指标类型匹配的目标监控数据;将所述目标监控数据与所述指标阈值规则进行比对,以判断所述设备节点是否处于异常状态;若所述设备节点处于异常状态,则生成所述异常状态对应的告警事件,并判断所述告警事件是否满足预先设置的告警规则;若满足,则确定与所述告警事件对应的目标修复脚本;依据所述目标修复脚本生成作业指令,并将所述作业指令发送至所述设备节点,以触发所述设备节点依据所述作业指令执行修复操作。应用本专利技术提供的设备的故障修复方法,能够确定告警事件对应的目标修复脚本,应用该修复脚本修复设备的故障,能够快速的修复设备的故障。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地本文档来自技高网...

【技术保护点】
1.一种设备的故障修复方法,其特征在于,包括:/n当接收到机器资源监控数据时,确定所述机器资源监控数据对应的设备节点;/n获取与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则;/n在所述机器资源监控数据中获取与所述监控指标类型匹配的目标监控数据;/n将所述目标监控数据与所述指标阈值规则进行比对,以判断所述设备节点是否处于异常状态;/n若所述设备节点处于异常状态,则生成所述异常状态对应的告警事件,并判断所述告警事件是否满足预先设置的告警规则;/n若满足,则确定与所述告警事件对应的目标修复脚本;/n依据所述目标修复脚本生成作业指令,并将所述作业指令发送至所述设备节点,以触发所述设备节点依据所述作业指令执行修复操作。/n

【技术特征摘要】
1.一种设备的故障修复方法,其特征在于,包括:
当接收到机器资源监控数据时,确定所述机器资源监控数据对应的设备节点;
获取与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则;
在所述机器资源监控数据中获取与所述监控指标类型匹配的目标监控数据;
将所述目标监控数据与所述指标阈值规则进行比对,以判断所述设备节点是否处于异常状态;
若所述设备节点处于异常状态,则生成所述异常状态对应的告警事件,并判断所述告警事件是否满足预先设置的告警规则;
若满足,则确定与所述告警事件对应的目标修复脚本;
依据所述目标修复脚本生成作业指令,并将所述作业指令发送至所述设备节点,以触发所述设备节点依据所述作业指令执行修复操作。


2.根据权利要求1所述的方法,其特征在于,所述获取与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则,包括:
依据所述设备节点的设备节点标识遍历预先设置的配置文件,获得与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则。


3.根据权利要求1所述的方法,其特征在于,判断所述告警事件是否满足预先设置的告警规则包括:
依据预先设置的告警白名单判断所述告警事件当前是否处于抑制状态;
若所述告警事件未处于所述抑制状态,则获取所述设备节点在预设时段内对应的告警记录;
判断所述告警记录中是否存在与所述告警事件相关联的历史告警事件;
若存在,则判断所述告警事件与所述历史告警事件是否满足预先设置的聚合规则,若满足,则确定所述告警事件满足所述告警规则;
若不存在,则确定所述告警事件满足所述告警规则。


4.根据权利要求3所述的方法,其特征在于,若所述告警事件与所述历史告警事件是否满足预先设置的聚合规则,则所述确定与所述告警事件对应的目标修复脚本,包括:
将所述告警事件以及所述历史告警事件进行聚合操作,得到目标告警事件;
依据所述目标告警事件在预先建立的脚本文件库中确定目标修复脚本。


5.根据权利要求1所述的方法,其特征在于,确定所述告警事件满足所述告警规则之后,还包括:
判断所述告警事件是否满足预先设置的告警通知规则,若满足,则生成与所述告警事件对应的告警通知消息;
确定与所述设备节点对应的告警接收组,将所述告警通知消息发送至所述告警接收组中的各个对象。


6.根据权利要求1所述的方法,其特征在于,所述依据所述目标修复脚本生成作业指令,包括:
获取所述设备节点的IP地址信息以及所述设备节点所...

【专利技术属性】
技术研发人员:刘士建
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1