【技术实现步骤摘要】
网络设备故障处理方法、装置、电子设备及存储介质
[0001]本申请涉及智能运维
,具体而言,本申请涉及一种网络设备故障处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]随着各类高可用集群,各类安全、网络、服务器等设备层出不穷,技术组件也越来越多,当设备中的组件出现故障时,面向海量的告警信息单纯依靠人力将无法快速响应排障需求。
[0003]目前实现故障自愈的方法主要是依赖人工提前梳理好的固化知识库,即包含了故障类型和对应处理方案的知识库,故障发生且定位出故障的类型后,通过预设脚本直接启动固化知识库中的对应处理方案,实现故障的自动处理修复。
[0004]但是人工梳理的故障处理方案不一定完全合理,即方案执行后未必能完成该故障的自动修复,因此现有技术在实现设备故障的自动处理修复时缺乏一定的检测机制。
技术实现思路
[0005]本申请实施例提供了一种网络设备故障处理的方法、装置、电子设备、计算机可读存储介质及计算机程序产品,可以解决故障处理缺乏检测机制的问题。所述技术方案如下: ...
【技术保护点】
【技术特征摘要】
1.一种网络设备故障处理的方法,其特征在于,包括:获取运维数据集,所述运维数据集包括至少一个网络设备的运维数据;对所述运维数据集进行异常检测,确定所述运维数据集中的异常运维数据,基于所述异常运维数据确定设备故障;对所述设备故障进行根因定位,确定故障根因;基于预先确定的知识图谱确定所述故障根因的至少一个候选处置策略;使用数字孪生技术对所述至少一个候选处置策略进行测试,根据各个候选处置策略的测试结果,从所述至少一个候选处置策略中确定目标处置策略;执行所述目标处置策略。2.根据权利要求1所述的方法,其特征在于,所述运维数据包括日志数据和性能指标数据中的至少一者;所述对所述运维数据集进行异常检测,确定所述运维数据集中的异常运维数据,基于所述异常运维数据确定设备故障,包括以下至少一者:对于任意一种性能指标数据,根据所述性能指标数据的类型确定相应的异常检测算法,根据所述异常检测算法、静态阈值策略和异常聚合策略,对所述性能指标数据进行异常检测;对于任意一种日志数据,根据所述日志数据的数量变化程度、关键词以及日志模式中的至少一者,对所述日志数据进行异常检测;对于任意一种性能指标数据,通过机器学习算法对所述性能指标数据的变化趋势进行预测,并结合预警策略对性能指标数据进行预警。3.根据权利要求2所述的方法,其特征在于,所述对所述运维数据集进行异常检测,确定所述运维数据集中的异常运维数据,基于所述异常运维数据确定设备故障,还包括:确定设备故障的严重程度等级。4.根据权利要求1所述的方法,其特征在于,基于预先确定的知识图谱确定所述故障根因的至少一个候选处置策略之前,还包括:确定所述故障根因与处置策略的对应关系;根据所述故障根因与处置策略的对应关系,构建知识图谱,所述知识图谱包括至少一个故障根因、与所述故障根因具有对应关系的处置策略以及相应处置策略的权重。5.根据权利要求1所述的方法,其特征在于,使用数字孪生技术对所述至少一个候选处置策略进行测试,根据各个候选处置策略的测试结果,...
【专利技术属性】
技术研发人员:苗大军,董昭阳,孟祥德,叶晓舟,
申请(专利权)人:亚信科技中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。