基于图对比的故障根因分析方法、装置、设备及介质制造方法及图纸

技术编号:38708505 阅读:13 留言:0更新日期:2023-09-08 14:49
本发明专利技术涉及运维处理技术领域,揭露一种基于图对比的故障根因分析方法,包括:收集系统运行过程中发生的历史故障生成的故障传播图,构建训练样本集对初始模型进行训练,得到训练好的图像识别模型对多个历史故障的故障传播图进行处理,将得到的多个故障向量构成的向量矩阵存储至数据库,当监测到系统发生实时故障时,将获取的实时故障的故障传播图输入图像识别模型中进行处理,得到实时故障的故障向量,计算实时故障的故障向量与向量矩阵中每个故障向量的相似度,筛选出相似度最大值对应的故障传播图,以该筛选出的故障传播图对应的根因作为实时故障的根因。本发明专利技术通过训练好的图像识别模型可以快速、准确地定位实时故障的根因。因。因。

【技术实现步骤摘要】
基于图对比的故障根因分析方法、装置、设备及介质


[0001]本专利技术涉及运维处理
,尤其涉及一种基于图对比的故障根因分析方法、装置、设备及介质。

技术介绍

[0002]随着数字医疗技术的发展,可以在IT系统的服务器上上传下载医疗数据,如个人健康档案、处方、检查报告等,如果系统出现故障,会造成极大的不便。根因定位在智能运维中扮演着非常重要的角色,在IT系统发生故障后,需要在多个告警的节点中快速的定位到故障源,以方便运维工程师在最短的时间内完成故障的修复,减少IT系统瘫痪对企业正常运作的影响,从而尽可能的降低企业的损失。然而,现有的根因定位技术还存在以下问题:在IT系统的实践过程中,重复性发生的故障占了很大的比例,意味着现有发生的故障很有可能在历史已经发生过了,而现有的传统机器学习方法并未对历史故障的数据加以利用,也没有充分挖掘各个节点之间的依赖关系,导致故障根因分析效率低、不够准确。

技术实现思路

[0003]鉴于以上内容,有必要提供一种基于图对比的故障根因分析方法,其目的在于解决现有技术中系统故障的根因分析效率低、不够准确的技术问题。
[0004]本专利技术提供的基于图对比的故障根因分析方法,包括:
[0005]收集系统运行过程中发生的历史故障生成的故障传播图,构建训练样本集,利用所述训练样本集对初始模型进行训练,得到训练好的图像识别模型;
[0006]利用所述图像识别模型对多个历史故障的故障传播图进行处理,得到多个故障向量构成的向量矩阵,将所述向量矩阵存储至数据库;<br/>[0007]当监测到系统发生实时故障时,将获取的实时故障的故障传播图输入所述图像识别模型中进行处理,得到所述实时故障的故障向量;
[0008]计算所述实时故障的故障向量与所述向量矩阵中每个故障向量的相似度,筛选出相似度最大值对应的故障传播图,以该筛选出的故障传播图对应的根因作为所述实时故障的根因。
[0009]可选的,所述故障传播图包括根因告警节点、非根因告警节点和未告警节点,所述构建训练样本集,包括:
[0010]选取第i次故障生成的故障传播图的根因告警节点、非根因告警节点在故障发生前预设时间内的监测数据作为第一指标
[0011]及第i次故障生成的故障传播图的所有节点之间的调用关系作为第二指标
[0012]将所述第一指标和所述第二指标构成训练样本
[0013]根据所有历史故障的故障传播图构成的训练样本生成训练样本集。
[0014]可选的,所述构建训练样本集还包括:
[0015]S10、选取任一训练样本作为训练样本集的第i个训练样本;
[0016]S11、确定所述第i个训练样本的根因告警节点的位置;
[0017]S12、将与所述第i个训练样本的根因告警节点位置相同的训练样本作为为所述第i个训练样本的正样本,及将与所述第i个训练样本的根因告警节点位置不相同的训练样本作为为所述第i个样本的负样本;
[0018]S13、对所述训练样本集的每个训练样本重复执行步骤S10

S12,得到所述训练样本集的各个训练样本的正样本和负样本。
[0019]可选的,所述利用所述训练样本集对初始模型进行训练,得到训练好的图像识别模型,包括:
[0020]将第i个训练样本及与第i个训练样本相对应的正样本和负样本输入到所述初始模型中进行前向传播,得到所述第i个训练样本的隐藏向量h
i
、所述正样本的隐藏向量所述负样本的隐藏向量
[0021]将所述隐藏向量h
i
、输入损失函数,计算得到损失值,所述损失函数的公式为:
[0022][0023]其中,L为损失函数值,为h
i
和两个向量之间的余弦相似度,为h
i
和两个向量之间的余弦相似度;
[0024]利用所述第i个训练样本对所述初始模型进行反向传播,得到更新的模型参数;
[0025]利用所述更新的模型参数对所述初始模型进行迭代,直至所述损失函数的损失值小于预设的阈值,得到所述训练好的图像识别模型。
[0026]可选的,所述将第i个训练样本及与第i个训练样本相对应的正样本和负样本输入到所述初始模型中进行前向传播,得到所述第i个训练样本的隐藏向量h
i
、所述正样本的隐藏向量所述负样本的隐藏向量包括:
[0027]将第i个训练样本及与第i个训练样本相对应的正样本和负样本在所述初始模型中依次经过图神经网络的GCN层、ReLU激活函数、Linear线性神经网络层:
[0028][0029][0030][0031]其中,和分别为第i个训练样本、与第i个训练样本对应的正样本、及与第i个训练样本对应的负样本的第一指标,与第i个训练样本对应的负样本的第一指标,和分别为第i个训练样本、与第i个训练样本对应的正样本、及与第i个训练样本对应的负样本的第二指标。
[0032]可选的,所述图像识别模型对多个历史故障的故障传播图进行处理,得到多个故障向量构成的向量矩阵,包括:
[0033]利用所述图像识别模型对n个历史故障的故障传播图进行编码和归一化操作,分别得到每个历史故障对应的维度为d的故障向量,得到由n个故障向量构成的向量矩阵H∈R
n
×
d

[0034]可选的,所述将获取的实时故障的故障传播图输入所述图像识别模型中进行处理,得到所述实时故障的故障向量,包括:
[0035]所述图像识别模型对实时故障的故障传播图进行编码和归一化操作,得到实时故障的维度为d的故障向量y∈R
d
×1。
[0036]为了解决上述问题,本专利技术还提供一种基于图对比的故障根因分析装置,所述装置包括:
[0037]训练模块,用于收集系统运行过程中发生的历史故障生成的故障传播图,构建训练样本集,利用所述训练样本集对初始模型进行训练,得到训练好的图像识别模型;
[0038]存储模块,用于利用所述图像识别模型对多个历史故障的故障传播图进行处理,得到多个故障向量构成的向量矩阵,将所述向量矩阵存储至数据库;
[0039]处理模块,用于当监测到系统发生实时故障时,将获取的实时故障的故障传播图输入所述图像识别模型中进行处理,得到所述实时故障的故障向量;
[0040]预测模块,用于计算所述实时故障的故障向量与所述向量矩阵中每个故障向量的相似度,筛选出相似度最大值对应的故障传播图,以该筛选出的故障传播图对应的根因作为所述实时故障的根因。
[0041]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0042]至少一个处理器;以及,
[0043]与所述至少一个处理器通信连接的存储器;其中,
[0044]所述存储器存储有可被所述至少一个处理器执行的基于图对比的故障根因分析程序,所述基于图对比的故障根因分析程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图对比的故障根因分析方法,其特征在于,所述方法包括:收集系统运行过程中发生的历史故障生成的故障传播图,构建训练样本集,利用所述训练样本集对初始模型进行训练,得到训练好的图像识别模型;利用所述图像识别模型对多个历史故障的故障传播图进行处理,得到多个故障向量构成的向量矩阵,将所述向量矩阵存储至数据库;当监测到系统发生实时故障时,将获取的实时故障的故障传播图输入所述图像识别模型中进行处理,得到所述实时故障的故障向量;计算所述实时故障的故障向量与所述向量矩阵中每个故障向量的相似度,筛选出相似度最大值对应的故障传播图,以该筛选出的故障传播图对应的根因作为所述实时故障的根因。2.如权利要求1所述的基于图对比的故障根因分析方法,其特征在于,所述故障传播图包括根因告警节点、非根因告警节点和未告警节点,所述构建训练样本集,包括:选取第i次故障生成的故障传播图的根因告警节点、非根因告警节点在故障发生前预设时间内的监测数据作为第一指标及第i次故障生成的故障传播图的所有节点之间的调用关系作为第二指标将所述第一指标和所述第二指标构成训练样本根据所有历史故障的故障传播图构成的训练样本生成训练样本集。3.如权利要求2所述的基于图对比的故障根因分析方法,其特征在于,所述构建训练样本集还包括:S10、选取任一训练样本作为训练样本集的第i个训练样本;S11、确定所述第i个训练样本的根因告警节点的位置;S12、将与所述第i个训练样本的根因告警节点位置相同的训练样本作为为所述第i个训练样本的正样本,及将与所述第i个训练样本的根因告警节点位置不相同的训练样本作为为所述第i个样本的负样本;S13、对所述训练样本集的每个训练样本重复执行步骤S10

S12,得到所述训练样本集的各个训练样本的正样本和负样本。4.如权利要求1或3所述的基于图对比的故障根因分析方法,其特征在于,所述利用所述训练样本集对初始模型进行训练,得到训练好的图像识别模型,包括:将第i个训练样本及与第i个训练样本相对应的正样本和负样本输入到所述初始模型中进行前向传播,得到所述第i个训练样本的隐藏向量h
i
、所述正样本的隐藏向量所述负样本的隐藏向量将所述隐藏向量h
i
、输入损失函数,计算得到损失值,所述损失函数的公式为:其中,L为损失函数值,为h
i
和两个向量之间的余弦相似度,
为h
i
和两个向量之间的余弦相似度;利用所述第i个训练样本对所述初始模型进行反向传播,得到更新的模型参数;利用所述更新的模型参数对所述初始模型进行迭代,直至所述损失函数的损失值小于预设的阈值,得到所述训练好的图像识别模型。5.如权利要求4所述的基于图对比的故障根因分析方法,其特征在于,所述将第i个训练样本及与第i个训练样本相对应的正样本和负样本输入到所述初始模型中进行前向传播,得到所述第i个训练样本的隐藏向量h

【专利技术属性】
技术研发人员:李同巴堃庄伯金
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1