故障定位方法及装置制造方法及图纸

技术编号:39061803 阅读:12 留言:0更新日期:2023-10-12 19:54
本申请涉及计算机领域,提供一种故障定位方法及装置。方法包括:将目标故障描述语句输入标签推荐模型,得到标签推荐模型输出的至少一个故障标签;将至少一个故障标签输入故障定位模型,得到故障定位模型输出的目标故障描述语句对应的故障根源;其中,标签推荐模型是基于故障描述语句样本、故障描述语句样本对应的故障标签样本和加权二元交叉熵损失函数对长短期神经网络LSTM模型进行训练得到的;故障定位模型是基于故障标签样本以及故障标签样本对应的故障根源样本对反向传播BP神经网络模型进行训练得到的。本申请实施例提供的故障定位方法及装置可以快速找到故障的根源,节省故障定位的时间。障定位的时间。障定位的时间。

【技术实现步骤摘要】
故障定位方法及装置


[0001]本申请涉及计算机
,具体涉及一种故障定位方法及装置。

技术介绍

[0002]目前,现有的数据中心业务系统为分布式部署,分为基础设施即服务(Infrastructure as a Service,IaaS)、平台即服务(Platform as a Service,PaaS)和软件即服务(Software as a Service,SaaS)三层,一个业务系统以集群方式部署在多个虚拟机上,并且会用到很多第三方组件,当出现故障后,很难定位是由哪层引发的故障,一般是运维专家根据经验和知识判定异常原因,根据错误码排查相关的机器,从日志、状态各方面,各节点一点点查看,甚至需要召开专家小组会议,共同会诊问题,比较耗时,耗力。

技术实现思路

[0003]本申请实施例提供一种故障定位方法及装置,用以解决工单的分配效率低的技术问题。
[0004]第一方面,本申请实施例提供一种故障定位方法,包括:
[0005]获取目标故障描述语句,将所述目标故障描述语句输入标签推荐模型,得到所述标签推荐模型输出的至少一个故障标签;
[0006]将所述至少一个故障标签输入故障定位模型,得到所述故障定位模型输出的所述目标故障描述语句对应的故障根源;
[0007]其中,所述标签推荐模型是基于故障描述语句样本、所述故障描述语句样本对应的故障标签样本和加权二元交叉熵损失函数对长短期神经网络LSTM模型进行训练得到的;
[0008]所述故障定位模型是基于所述故障标签样本以及所述故障标签样本对应的故障根源样本对反向传播BP神经网络模型进行训练得到的。
[0009]在一个实施例中,所述标签推荐模型包括词嵌入层、双向LSTM层和注意力层;
[0010]所述将所述目标故障描述语句输入标签推荐模型,得到所述标签推荐模型输出的至少一个故障标签包括:
[0011]将所述目标故障描述语句输入所述词嵌入层,得到所述词嵌入层输出的所述目标故障描述语句中的各个词语对应的词向量;
[0012]将所述词向量输入所述双向LSTM层,进行前向LSTM处理和反向LSTM处理,得到所述双向LSTM层输出的所述各个词语对应的隐藏层状态;
[0013]将所述隐藏层状态输入所述注意力层,确定每个所述隐藏层状态对应的权重,并基于所述隐藏层状态和每个所述隐藏层状态对应的权重确定所述目标故障描述语句的向量表示;
[0014]基于所述目标故障描述语句的向量表示确定各个候选故障标签的置信概率,并基于所述各个候选故障标签的置信概率的大小得到所述标签推荐模型输出的所述至少一个故障标签。
[0015]在一个实施例中,所述确定每个所述隐藏层状态对应的权重包括:
[0016]基于权重矩阵、偏置向量和各个所述隐藏层状态,确定每个隐藏层状态的能量值;
[0017]基于所述每个隐藏层状态的能量值和初始化关注矩阵确定每个所述隐藏层状态对应的权重。
[0018]在一个实施例中,还包括:
[0019]获取所述故障标签样本以及所述故障标签样本对应的故障根源样本;
[0020]将所述故障标签样本以及所述故障标签样本对应的故障根源样本输入所述LSTM模型进行训练,得到所述LSTM模型输出的正类别故障标签和负类别故障标签;
[0021]基于所述正类别故障标签和所述负类别故障标签,利用加权二元交叉熵损失函数计算正类别损失和负类别损失,并基于所述正类别损失和所述负类别损失得到总损失;
[0022]在所述总损失小于第一阈值的情况下,保存所述LSTM模型的参数,得到所述标签推荐模型。
[0023]在一个实施例中,所述方法还包括:
[0024]确定所述输入层和所述输出层;
[0025]基于所述输入层的节点数和所述输出层的节点数,利用第一公式,确定神经元数,基于所述神经元数确定所述隐层;
[0026]基于所述输入层、所述输出层和所述隐层得到所述BP神经网络模型;
[0027]所述第一公式为:
[0028][0029]其中,l为神经元数,n为所述输入层的节点数,m为所述输出层的节点数,a为调节参数。
[0030]第二方面,本申请实施例提供一种故障定位装置,包括:
[0031]故障标签确定模块,用于:获取目标故障描述语句,将所述目标故障描述语句输入标签推荐模型,得到所述标签推荐模型输出的至少一个故障标签;
[0032]故障根源确定模块,用于:将所述至少一个故障标签输入故障定位模型,得到所述故障定位模型输出的所述目标故障描述语句对应的故障根源;
[0033]其中,所述标签推荐模型是基于故障描述语句样本、所述故障描述语句样本对应的故障标签样本和加权二元交叉熵损失函数对长短期神经网络LSTM模型进行训练得到的;
[0034]所述故障定位模型是基于所述故障标签样本以及所述故障标签样本对应的故障根源样本对反向传播BP神经网络模型进行训练得到的。
[0035]在一个实施例中,所述标签推荐模型包括词嵌入层、双向LSTM层和注意力层;
[0036]所述将所述目标故障描述语句输入标签推荐模型,得到所述标签推荐模型输出的至少一个故障标签包括:
[0037]将所述目标故障描述语句输入所述词嵌入层,得到所述词嵌入层输出的所述目标故障描述语句中的各个词语对应的词向量;
[0038]将所述词向量输入所述双向LSTM层,进行前向LSTM处理和反向LSTM处理,得到所述双向LSTM层输出的所述各个词语对应的隐藏层状态;
[0039]将所述隐藏层状态输入所述注意力层,确定每个所述隐藏层状态对应的权重,并
基于所述隐藏层状态和每个所述隐藏层状态对应的权重确定所述目标故障描述语句的向量表示;
[0040]基于所述目标故障描述语句的向量表示确定各个候选故障标签的置信概率,并基于所述各个候选故障标签的置信概率的大小得到所述标签推荐模型输出的所述至少一个故障标签。
[0041]第三方面,本申请实施例提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述的故障定位方法。
[0042]第四方面,本申请实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的故障定位方法。
[0043]第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面所述的故障定位方法。
[0044]本申请实施例提供的故障定位方法及装置,通过机器学习的方法分别构建标签推荐模型和故障定位模型,当出现故障时,运维人员只是将告警问题的描述数据输入标签推荐模型便可得到与该告警问题描述相对应的告警标签,随后便可将该告警标签输入故障定位模型,从而可以快速找到故障的根源,节省故障定位的时间,解决必须依靠经验才能做的故障定位难题,缩短了故障处理时长。
附图说明<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障定位方法,其特征在于,包括:获取目标故障描述语句,将所述目标故障描述语句输入标签推荐模型,得到所述标签推荐模型输出的至少一个故障标签;将所述至少一个故障标签输入故障定位模型,得到所述故障定位模型输出的所述目标故障描述语句对应的故障根源;其中,所述标签推荐模型是基于故障描述语句样本、所述故障描述语句样本对应的故障标签样本和加权二元交叉熵损失函数对长短期神经网络LSTM模型进行训练得到的;所述故障定位模型是基于所述故障标签样本以及所述故障标签样本对应的故障根源样本对反向传播BP神经网络模型进行训练得到的。2.根据权利要求1所述的故障定位方法,其特征在于,所述标签推荐模型包括词嵌入层、双向LSTM层和注意力层;所述将所述目标故障描述语句输入标签推荐模型,得到所述标签推荐模型输出的至少一个故障标签包括:将所述目标故障描述语句输入所述词嵌入层,得到所述词嵌入层输出的所述目标故障描述语句中的各个词语对应的词向量;将所述词向量输入所述双向LSTM层,进行前向LSTM处理和反向LSTM处理,得到所述双向LSTM层输出的所述各个词语对应的隐藏层状态;将所述隐藏层状态输入所述注意力层,确定每个所述隐藏层状态对应的权重,并基于所述隐藏层状态和每个所述隐藏层状态对应的权重确定所述目标故障描述语句的向量表示;基于所述目标故障描述语句的向量表示确定各个候选故障标签的置信概率,并基于所述各个候选故障标签的置信概率的大小得到所述标签推荐模型输出的所述至少一个故障标签。3.根据权利要求2所述的故障定位方法,其特征在于,所述确定每个所述隐藏层状态对应的权重包括:基于权重矩阵、偏置向量和各个所述隐藏层状态,确定每个隐藏层状态的能量值;基于所述每个隐藏层状态的能量值和初始化关注矩阵确定每个所述隐藏层状态对应的权重。4.根据权利要求1所述的故障定位方法,其特征在于,还包括:获取所述故障标签样本以及所述故障标签样本对应的故障根源样本;将所述故障标签样本以及所述故障标签样本对应的故障根源样本输入所述LSTM模型进行训练,得到所述LSTM模型输出的正类别故障标签和负类别故障标签;基于所述正类别故障标签和所述负类别故障标签,利用加权二元交叉熵损失函数计算正类别损失和负类别损失,并基于所述正类别损失和所述负类别损失得到总损失;在所述总损失小于第一阈值的情况下,保存所述LSTM模型的参数,得到所述标签推荐模型。5.根据权利要求1所述的故障定位方法,其特征在于,所...

【专利技术属性】
技术研发人员:李琚彪晋京刘馨婷吴晶初瑞纪广勇
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1