【技术实现步骤摘要】
根因定位模型训练方法、根因定位方法及装置
[0001]本说明书一个或多个实施例涉及计算机
,尤其涉及一种根因定位模型训练方法、根因定位方法及装置。
技术介绍
[0002]随着微服务和云计算时代的到来,当微服务系统中的应用服务或关键性能指标发生异常时,需要运维人员对发生故障的容器进行准确的根因定位和快速的恢复,以便确保微服务系统的稳定性和可靠性,同时最大限度地减少停机时间和性能下降。
[0003]相关技术中,通常采用神经网络模型进行根因定位。然而这些模型需要基于人工标记的数据进行训练,在标记过程中需要消耗大量人工成本,且无法学习到系统中完整的因果关系结构,准确度较差。
技术实现思路
[0004]有鉴于此,本说明书一个或多个实施例提供一种根因定位模型训练方法、根因定位方法及装置。
[0005]为实现上述目的,本说明书一个或多个实施例提供技术方案如下:
[0006]根据本说明书一个或多个实施例的第一方面,提出了一种根因定位模型训练方法,包括:
[0007]构建目标系统的因果图, ...
【技术保护点】
【技术特征摘要】
1.一种根因定位模型训练方法,包括:构建目标系统的因果图,所述因果图包括多个节点和所述多个节点的邻接矩阵;其中,所述多个节点用于指示所述目标系统中的容器,所述邻接矩阵用于指示多个容器之间的因果关系;将所述多个节点的节点数据结合所述邻接矩阵输入所述根因定位模型,得到所述多个节点的预测数据;其中,所述多个节点中每个节点的节点数据包括该节点指示的容器的运行数据;根据所述预测数据与所述节点数据之间的损失,调整所述根因定位模型中的待学习参数,以完成根因定位模型的训练,所述根因定位模型用于定位所述目标系统中发生故障的容器。2.根据权利要求1所述的方法,所述根因定位模型包括编码器和解码器;所述编码器用于拟合所述待学习参数的概率分布;所述解码器用于根据所述待学习参数生成所述预测数据。3.根据权利要求2所述的方法,所述将所述多个节点的节点数据结合所述邻接矩阵输入所述根因定位模型,得到所述多个节点的预测数据,包括:将所述多个节点的节点数据结合所述邻接矩阵输入所述编码器,得到所述待学习参数的概率分布;根据所述待学习参数的概率分布,对所述待学习参数进行采样,得到样本参数;将所述样本参数输入所述解码器,得到所述多个节点的预测数据。4.根据权利要求2或3所述的方法,所述待学习参数包括多个第一参数和多个第二参数;所述多个第一参数分别用于示出所述多个节点各自的外生变量;所述多个第二参数分别用于示出所述多个节点各自是否存在干预,其中,存在干预的节点对应的容器为发生故障的容器。5.根据权利要求4所述的方法,所述根据所述预测数据与所述节点数据之间的损失,调整所述根因定位模型中的待学习参数,包括:根据所述预测数据与所述节点数据之间的损失,调整所述多个第一参数和所述多个第二参数。6.根据权利要求4所述的方法,所述多个节点中每个节点的节点数据还包括故障标签,所述故障标签用于示出该节点指示的容器是否发生故障;所述根据所述预测数据与所述节点数据之间的损失,调整所述根因定位模型中的待学习参数,包括:根据所述预测数据与所述节点数据之间的损失,调整所述多个第一参数;根据多个第二样本参数与所述故障标签之间的损失,调整所述多个第二参数,其中,多个第二样本参数通过对所述多个第二参数的概率分布采样获得。7.根据权利要求4所述的方法,所述待学习参数还包括第三参数,所述第三参数为所述编码器的泛化参数。8.根据权利要求7所述的方法,所述第三参数根据所述预测数据与所述节点数据之间的损失调整。
9.一种根因定位方法,包括:在目标系统发生故障的情况下,获取所述目标系统中多个容器各自的运行数据;构建所述目标系统的因...
【专利技术属性】
技术研发人员:陶洪元,余航,李建国,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。