一种应用的故障处理方法、装置、设备、介质及程序产品制造方法及图纸

技术编号:35501487 阅读:18 留言:0更新日期:2022-11-09 14:10
本申请提供了一种应用的故障处理方法,该方法包括:当应用发生故障时,获取所述应用的调用关系以及所述应用的资源依赖关系,然后根据所述应用的调用关系以及所述应用的资源依赖关系进行故障分析,获得分析结果,所述分析结果包括所述故障发生的根因。该方法在进行根因分析的过程中,不仅基于应用的调用关系,而且还基于应用的资源依赖关系进行根因分析,即根因分析所依据的数据更加丰富。如此,该方法能够快速且准确地定位出故障发生的根因,提高根因分析的效率。根因分析的效率。根因分析的效率。

【技术实现步骤摘要】
一种应用的故障处理方法、装置、设备、介质及程序产品


[0001]本申请涉及云计算
,尤其涉及一种应用的故障处理方法、装置、设备、介质及程序产品。

技术介绍

[0002]随着云原生技术的日益普及,应用之间的调用关系越来越复杂,当应用出现故障时,会使与该应用存在调用关系的其他应用出现故障,进而引发海量的告警。
[0003]为了从海量的告警中,找到引发海量的告警的根因,通常会通过应用探针收集应用之间的调用参数并存储,进而基于存储的调用参数得到应用之间的调用关系,接着根据应用之间的调用关系进行根因分析(root cause analysis,RCA),进而得到引发海量的告警的根因。
[0004]然而,仅根据应用之间的调用关系进行根因分析时,所依据的数据过于单一,难以从海量的告警中,快速地确定出应用发生故障的根因,根因分析的效率低下。

技术实现思路

[0005]本申请提供了一种应用的故障处理方法,该方法在应用发生故障后,进行故障的根因分析时,所依据的数据包括应用的调用关系以及该应用的资源依赖关系,即所依据的数据更加丰富,如此提高了根因分析的效率。本申请还提供了上述方法对应的装置、设备、计算机可读存储介质以及计算机程序产品。
[0006]第一方面,本申请提供了一种应用的故障处理方法。该方法可以由监控系统执行,具体地,当应用发生故障时,监控系统获取应用的调用关系以及应用的资源依赖关系,接着根据应用的调用关系以及应用的资源依赖关系进行故障分析,获得分析结果。在该分析结果中包括故障发生的根因。
[0007]该方法在进行根因分析的过程中,不仅基于应用的调用关系,而且还基于应用的资源依赖关系进行根因分析,即根因分析所依据的数据更加丰富。如此,该方法能够快速且准确地定位出故障发生的根因,提高根因分析的效率。
[0008]在一些可能的实现方式中,监控系统还可以根据应用的调用关系和应用的资源依赖关系构建应用的拓扑图,如此,在故障分析时,监控系统可以基于构建的应用的拓扑图,采用基于图结构数据的根因分析算法进行故障分析。在一种示例中,应用的拓扑图可以存储在采用图引擎服务的图数据库中,该图数据库具体响应速度快的特点,进而能够进一步提高故障分析的效率。
[0009]在一些可能的实现方式中,调用关系可以通过调用链表征,监控系统可以根据故障的关联应用,从调用链中提取核心子链路,该核心子链路为调用链中包括关联应用的子链路,然后根据核心子链路和应用的资源依赖关系构建应用的拓扑图。基于核心子链路构建得到的应用的拓扑图,能够减少与故障无关的其他应用对应的子链路对故障分析的影响,排除了一部分干扰数据,进而提高故障分析的效率。
[0010]在一些可能的实现方式中,在提取核心子链路之前,监控系统可以获取通过调用链的入口传入的入口标识,然后根据入口标识对调用链的子链路进行聚类,如此,该方法能够实现在调用链的入口粒度来区分不同类的子链路,避免了子链路过多的情况。
[0011]在一些可能的实现方式中,调用关系可以通过调用链表征,资源依赖关系可以通过资源链表征,监控系统可以从调用链中确定故障的发生时间段内的子链路,以及从资源链中确定故障的发生时间段内的子资源链,然后根据子链路、子资源链以及发生时间段构建应用的拓扑图。
[0012]在一些可能的实现方式中,监控系统还可以通过用户图形界面接收用户输入的查询时间段,然后向用户呈现查询时间段对应应用的拓扑图。如此,用户能够更加直观的了解到每一个时间段内的应用的调用关系以及应用的资源依赖关系。
[0013]在一些可能的实现方式中,监控系统还可以通过用户图形界面接收用户输入的应用标识,根据该应用标识,确定目标应用,然后监控系统可以向用户呈现用户所输入的时间段内对应的目标应用的拓扑图。如此,用户能够从众多的应用中,清楚地了解到目标应用的调用关系以及目标应用的资源依赖关系。
[0014]第二方面,本申请提供一种应用的故障处理装置,该装置包括:
[0015]获取模块,用于当应用发生故障时,获取应用的调用关系以及应用的资源依赖关系;
[0016]分析模块,用于根据应用的调用关系以及应用的资源依赖关系进行故障分析,获得分析结果,分析结果包括故障发生的根因。
[0017]在一些可能的实现方式中,该装置还包括构建模块,构建模块用于根据所述应用的调用关系以及所述应用的资源依赖关系构建所述应用的拓扑图;
[0018]分析模块,具体用于根据所述应用的拓扑图,采用基于图结构数据的根因分析算法进行故障分析。
[0019]在一些可能的实现方式中,所述调用关系通过调用链表征,所述构建模块,具体用于根据所述故障的关联应用,从所述调用链中提取核心子链路,所述核心子链路为所述调用链中包括所述关联应用的子链路;根据所述核心子链路和所述应用的资源依赖关系构建所述应用的拓扑图。
[0020]在一些可能的实现方式中,该装置还包括:聚类模块;
[0021]所述获取模块,还用于获取通过所述调用链的入口传入的入口标识;
[0022]所述聚类模块,用于根据所述入口标识对所述调用链的子链路聚类。
[0023]在一些可能的实现方式中,所述调用关系通过调用链表征,所述资源依赖关系通过资源链表征,所述构建模块,具体用于从所述调用链中确定所述故障的发生时间段内的子链路;从所述资源链中确定所述故障的发生时间段内的子资源链;根据所述子链路、所述子资源链以及所述发生时间段构建所述应用的拓扑图。
[0024]在一些可能的实现方式中,该装置还包括,显示模块;
[0025]所述显示模块,用于接收用户输入的查询时间段;向所述用户呈现所述查询时间段对应的所述应用的拓扑图。
[0026]在一些可能的实现方式中,所述显示模块,还用于接收所述用户输入的应用标识;根据所述应用标识,确定目标应用;向所述用户呈现所述查询时间段对应的所述目标应用
的拓扑图。
[0027]第三方面,本申请提供一种设备,所述设备包括处理器和存储器。所述处理器、所述存储器进行相互的通信。所述处理器用于执行所述存储器中存储的指令,以使得设备执行如第一方面或第一方面的任一种实现方式中的应用的故障处理方法。
[0028]第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,所述指令指示设备执行上述第一方面或第一方面的任一种实现方式所述的应用的故障处理方法。
[0029]第五方面,本申请提供了一种包含指令的计算机程序产品,当其在设备上运行时,使得设备执行上述第一方面或第一方面的任一种实现方式所述的应用的故障处理方法。
[0030]本申请在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。
附图说明
[0031]为了更清楚地说明本申请实施例的技术方法,下面将对实施例中所需使用的附图作以简单地介绍。
[0032]图1为本申请实施例提供的一种监控系统的系统架构图;
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用的故障处理方法,其特征在于,所述方法包括:当应用发生故障时,获取所述应用的调用关系以及所述应用的资源依赖关系;根据所述应用的调用关系以及所述应用的资源依赖关系进行故障分析,获得分析结果,所述分析结果包括所述故障发生的根因。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述应用的调用关系以及所述应用的资源依赖关系构建所述应用的拓扑图;所述根据所述应用的调用关系以及所述应用的资源依赖关系进行故障分析,包括:根据所述应用的拓扑图,采用基于图结构数据的根因分析算法进行故障分析。3.根据权利要求2所述的方法,其特征在于,所述调用关系通过调用链表征,所述根据所述应用的调用关系以及所述应用的资源依赖关系构建所述应用的拓扑图,包括:根据所述故障的关联应用,从所述调用链中提取核心子链路,所述核心子链路为所述调用链中包括所述关联应用的子链路;根据所述核心子链路和所述应用的资源依赖关系构建所述应用的拓扑图。4.根据权利要求3所述的方法,其特征在于,在提取核心子链路之前,所述方法还包括:获取通过所述调用链的入口传入的入口标识;根据所述入口标识对所述调用链的子链路聚类。5.根据权利要求2至4任一项所述的方法,其特征在于,所述调用关系通过调用链表征,所述资源依赖关系通过资源链表征,所述根据所述应用的调用关系以及所述应用的资源依赖关系构建所述应用的拓扑图,包括:从所述调用链中确定所述故障的发生时间段内的子链路;从所述...

【专利技术属性】
技术研发人员:董辉潘畅杨奕卢剑清梁文婷
申请(专利权)人:华为云计算技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1