【技术实现步骤摘要】
基于图对比的故障根因分析方法、装置、设备及介质
[0001]本专利技术涉及运维处理
,尤其涉及一种基于图对比的故障根因分析方法、装置、设备及介质。
技术介绍
[0002]随着数字医疗技术的发展,可以在IT系统的服务器上上传下载医疗数据,如个人健康档案、处方、检查报告等,如果系统出现故障,会造成极大的不便。根因定位在智能运维中扮演着非常重要的角色,在IT系统发生故障后,需要在多个告警的节点中快速的定位到故障源,以方便运维工程师在最短的时间内完成故障的修复,减少IT系统瘫痪对企业正常运作的影响,从而尽可能的降低企业的损失。然而,现有的根因定位技术还存在以下问题:在IT系统的实践过程中,重复性发生的故障占了很大的比例,意味着现有发生的故障很有可能在历史已经发生过了,而现有的传统机器学习方法并未对历史故障的数据加以利用,也没有充分挖掘各个节点之间的依赖关系,导致故障根因分析效率低、不够准确。
技术实现思路
[0003]鉴于以上内容,有必要提供一种基于图对比的故障根因分析方法,其目的在于解决现有技术中系统故障的根因分析效率低、不够准确的技术问题。
[0004]本专利技术提供的基于图对比的故障根因分析方法,包括:
[0005]收集系统运行过程中发生的历史故障生成的故障传播图,构建训练样本集,利用所述训练样本集对初始模型进行训练,得到训练好的图像识别模型;
[0006]利用所述图像识别模型对多个历史故障的故障传播图进行处理,得到多个故障向量构成的向量矩阵,将所述向量矩阵存储至数据库;< ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于图对比的故障根因分析方法,其特征在于,所述方法包括:收集系统运行过程中发生的历史故障生成的故障传播图,构建训练样本集,利用所述训练样本集对初始模型进行训练,得到训练好的图像识别模型;利用所述图像识别模型对多个历史故障的故障传播图进行处理,得到多个故障向量构成的向量矩阵,将所述向量矩阵存储至数据库;当监测到系统发生实时故障时,将获取的实时故障的故障传播图输入所述图像识别模型中进行处理,得到所述实时故障的故障向量;计算所述实时故障的故障向量与所述向量矩阵中每个故障向量的相似度,筛选出相似度最大值对应的故障传播图,以该筛选出的故障传播图对应的根因作为所述实时故障的根因。2.如权利要求1所述的基于图对比的故障根因分析方法,其特征在于,所述故障传播图包括根因告警节点、非根因告警节点和未告警节点,所述构建训练样本集,包括:选取第i次故障生成的故障传播图的根因告警节点、非根因告警节点在故障发生前预设时间内的监测数据作为第一指标及第i次故障生成的故障传播图的所有节点之间的调用关系作为第二指标将所述第一指标和所述第二指标构成训练样本根据所有历史故障的故障传播图构成的训练样本生成训练样本集。3.如权利要求2所述的基于图对比的故障根因分析方法,其特征在于,所述构建训练样本集还包括:S10、选取任一训练样本作为训练样本集的第i个训练样本;S11、确定所述第i个训练样本的根因告警节点的位置;S12、将与所述第i个训练样本的根因告警节点位置相同的训练样本作为为所述第i个训练样本的正样本,及将与所述第i个训练样本的根因告警节点位置不相同的训练样本作为为所述第i个样本的负样本;S13、对所述训练样本集的每个训练样本重复执行步骤S10
‑
S12,得到所述训练样本集的各个训练样本的正样本和负样本。4.如权利要求1或3所述的基于图对比的故障根因分析方法,其特征在于,所述利用所述训练样本集对初始模型进行训练,得到训练好的图像识别模型,包括:将第i个训练样本及与第i个训练样本相对应的正样本和负样本输入到所述初始模型中进行前向传播,得到所述第i个训练样本的隐藏向量h
i
、所述正样本的隐藏向量所述负样本的隐藏向量将所述隐藏向量h
i
、输入损失函数,计算得到损失值,所述损失函数的公式为:其中,L为损失函数值,为h
i
和两个向量之间的余弦相似度,
为h
i
和两个向量之间的余弦相似度;利用所述第i个训练样本对所述初始模型进行反向传播,得到更新的模型参数;利用所述更新的模型参数对所述初始模型进行迭代,直至所述损失函数的损失值小于预设的阈值,得到所述训练好的图像识别模型。5.如权利要求4所述的基于图对比的故障根因分析方法,其特征在于,所述将第i个训练样本及与第i个训练样本相对应的正样本和负样本输入到所述初始模型中进行前向传播,得到所述第i个训练样本的隐藏向量h
技术研发人员:李同,巴堃,庄伯金,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。