The invention provides a fault repair method and device of the device, the method includes: when receiving the machine resource monitoring data, determining the device node corresponding to the machine resource monitoring data; obtaining the monitoring indicator type corresponding to the device node and the indicator threshold rule corresponding to the monitoring indicator type; obtaining the matching indicator type in the machine resource monitoring data Target monitoring data: compare the target monitoring data with the threshold rule to determine whether the device node is in an abnormal state; if the device node is in an abnormal state, generate an alarm event corresponding to the abnormal state, and determine whether the alarm event meets the pre-set alarm rules; if so, determine the target repair script corresponding to the alarm event; repair according to the target The script generates a job instruction and sends the job instruction to the device node to trigger the device node to perform a repair operation according to the job instruction. The method of the invention can quickly repair the fault of the equipment.
【技术实现步骤摘要】
设备的故障修复方法及装置
本专利技术涉及计算机运维领域,特别涉及一种设备的故障修复方法及装置。
技术介绍
随着科学技术的发展,计算机设备的应用已经覆盖了我们生活的方方面面,计算机设备的出现是20世纪最卓越的成就之一,它的应用领域从最初的军事科研应用扩展到社会的各个领域,已形成了规模巨大的计算机产业,带动了全球范围的技术进步,到了今天,在我们生活的方方面面,都离不开了计算机设备以及相关的网络设备。计算机设备以及其关联的网络设备在运行过程中,总会出现故障,当出现故障时,需要快速排查故障以修复故障,避免故障时间过长而导致各种各样的损失。然而,由于设备系统的复杂性较高,往往难以快速找到故障的解决方案。
技术实现思路
本专利技术所要解决的技术问题是提供一种设备的故障修复方法,能够快速的修复设备的故障。本专利技术还提供了一种设备的故障修复装置,用以保证上述方法在实际中的实现及应用。一种设备的故障修复方法,包括:当接收到机器资源监控数据时,确定所述机器资源监控数据对应的设备节点;获取与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则;在所述机器资源监控数据中获取与所述监控指标类型匹配的目标监控数据;将所述目标监控数据与所述指标阈值规则进行比对,以判断所述设备节点是否处于异常状态;若所述设备节点处于异常状态,则生成所述异常状态对应的告警事件,并判断所述告警事件是否满足预先设置的告警规则;若满足,则确定与所述告警事件对应的目 ...
【技术保护点】
1.一种设备的故障修复方法,其特征在于,包括:/n当接收到机器资源监控数据时,确定所述机器资源监控数据对应的设备节点;/n获取与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则;/n在所述机器资源监控数据中获取与所述监控指标类型匹配的目标监控数据;/n将所述目标监控数据与所述指标阈值规则进行比对,以判断所述设备节点是否处于异常状态;/n若所述设备节点处于异常状态,则生成所述异常状态对应的告警事件,并判断所述告警事件是否满足预先设置的告警规则;/n若满足,则确定与所述告警事件对应的目标修复脚本;/n依据所述目标修复脚本生成作业指令,并将所述作业指令发送至所述设备节点,以触发所述设备节点依据所述作业指令执行修复操作。/n
【技术特征摘要】
1.一种设备的故障修复方法,其特征在于,包括:
当接收到机器资源监控数据时,确定所述机器资源监控数据对应的设备节点;
获取与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则;
在所述机器资源监控数据中获取与所述监控指标类型匹配的目标监控数据;
将所述目标监控数据与所述指标阈值规则进行比对,以判断所述设备节点是否处于异常状态;
若所述设备节点处于异常状态,则生成所述异常状态对应的告警事件,并判断所述告警事件是否满足预先设置的告警规则;
若满足,则确定与所述告警事件对应的目标修复脚本;
依据所述目标修复脚本生成作业指令,并将所述作业指令发送至所述设备节点,以触发所述设备节点依据所述作业指令执行修复操作。
2.根据权利要求1所述的方法,其特征在于,所述获取与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则,包括:
依据所述设备节点的设备节点标识遍历预先设置的配置文件,获得与所述设备节点对应的监控指标类型以及所述监控指标类型对应的指标阈值规则。
3.根据权利要求1所述的方法,其特征在于,判断所述告警事件是否满足预先设置的告警规则包括:
依据预先设置的告警白名单判断所述告警事件当前是否处于抑制状态;
若所述告警事件未处于所述抑制状态,则获取所述设备节点在预设时段内对应的告警记录;
判断所述告警记录中是否存在与所述告警事件相关联的历史告警事件;
若存在,则判断所述告警事件与所述历史告警事件是否满足预先设置的聚合规则,若满足,则确定所述告警事件满足所述告警规则;
若不存在,则确定所述告警事件满足所述告警规则。
4.根据权利要求3所述的方法,其特征在于,若所述告警事件与所述历史告警事件是否满足预先设置的聚合规则,则所述确定与所述告警事件对应的目标修复脚本,包括:
将所述告警事件以及所述历史告警事件进行聚合操作,得到目标告警事件;
依据所述目标告警事件在预先建立的脚本文件库中确定目标修复脚本。
5.根据权利要求1所述的方法,其特征在于,确定所述告警事件满足所述告警规则之后,还包括:
判断所述告警事件是否满足预先设置的告警通知规则,若满足,则生成与所述告警事件对应的告警通知消息;
确定与所述设备节点对应的告警接收组,将所述告警通知消息发送至所述告警接收组中的各个对象。
6.根据权利要求1所述的方法,其特征在于,所述依据所述目标修复脚本生成作业指令,包括:
获取所述设备节点的IP地址信息以及所述设备节点所...
【专利技术属性】
技术研发人员:刘士建,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。