【技术实现步骤摘要】
一种自动化故障管理方法、装置及系统
本专利技术涉及信息系统运行维护
,特别涉及一种自动化故障管理方法、装置及系统。
技术介绍
IT系统线上故障管理在系统的日常运维中尤为重要,不仅考验技术,更考验时效。现阶段常规的系统线上故障管理过程中,从故障识别到故障恢复整个链路所需耗时太长,并且,如果不能在短时间内一次找准故障根因并进行修复,整个故障时间有倍增风险。系统故障造成的业务中断对一个企业来说往往是不可接受的,可能是损失大量订单、也可能是客户流失,极端情况下会造成不良社会影响。因此,亟待寻求一种能快速、准确找到并处理故障的方法。
技术实现思路
为解决上述技术问题,本专利技术提供了一种自动化故障管理方法、装置及系统,其在处理系统故障时实现全程自动化,提高故障处理的准确性并时效。本专利技术提供的技术方案如下:第一方面,提供一种自动化故障管理方法,所述方法至少包括如下步骤:根据接收到的故障提示信息识别系统故障并触发相应维度的故障工单;根据故障工单生成相应维度内的若 ...
【技术保护点】
1.一种自动化故障管理方法,其特征在于,所述方法包括如下步骤:/n根据接收到的故障提示信息识别系统故障并触发相应维度的故障工单;/n根据故障工单生成相应维度内的若干故障排查任务,并行执行若干故障排查任务以定位故障点;/n在预设的恢复预案匹配关系中查找与所述故障点相匹配的恢复预案,执行恢复预案以对系统故障进行修复。/n
【技术特征摘要】
1.一种自动化故障管理方法,其特征在于,所述方法包括如下步骤:
根据接收到的故障提示信息识别系统故障并触发相应维度的故障工单;
根据故障工单生成相应维度内的若干故障排查任务,并行执行若干故障排查任务以定位故障点;
在预设的恢复预案匹配关系中查找与所述故障点相匹配的恢复预案,执行恢复预案以对系统故障进行修复。
2.根据权利要求1所述的方法,其特征在于,所述根据接收到的故障提示信息识别系统故障并触发相应维度的故障工单,包括如下子步骤:
接收多维度监控告警信息或人工告警信息中的至少一种故障提示信息;
基于预先构建的故障工单触发模型,根据所述多维度告警信息、人工告警信息生成相应维度的故障工单。
3.根据权利要求2所述的方法,其特征在于,当所述故障提示信息为人工告警信息时,所述基于预先构建的故障工单触发模型,根据所述多维度告警信息、人工告警信息生成相应维度的故障工单之前,还包括:
采用自然语言处理算法对接收到的人工告警信息处理获得语义分析结果;
在预先构建的故障分类表中查找是否具有与所述语义分析结果匹配的告警维度,若有,则为所述人工告警信息标记相应的告警维度;
若无则标记通用告警维度。
4.根据权利要求1所述的方法,其特征在于,所述根据故障工单生成相应维度内的若干故障排查任务,并行执行若干故障排查任务以定位故障点,包括如下子步骤:
基于预先设置的故障排查任务关联关系,根据故障工单的故障信息查找相应维度内与所述故障工单匹配的若干故障排查任务;
并行执行所述若干故障排查任务并获得相应数量的故障排查结果;
基于预先设置的排查结果与故障点的关联关系,根据故障排查结果获得故障点。
5.根据权利要求1所述的方法,其特征在于,在预设的恢复预案匹配关系中查找与所述故障点相匹配的恢复预案,执行恢复预案以对系统故障进行修复,包括如下子步骤:
基于预设的恢复预案匹配关系,根据所述故障点查找与之匹配的若干恢复预案及相应的优先级排序;
执行最优的恢复预案以对系统故障进行修复并获得修复结果;
判断修复结果,若未修复,则执行次优的恢复预案,至修复结果为已修复,解除故障工单。
<...
【专利技术属性】
技术研发人员:杨微,何俊敏,易玉凤,马兴,
申请(专利权)人:上海燕汐软件信息科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。