故障根因定位方法、装置、设备及可读存储介质制造方法及图纸

技术编号:36261862 阅读:60 留言:0更新日期:2023-01-07 10:00
本申请公开了一种故障根因定位方法、装置、设备及可读存储介质,该方法包括当出现业务请求处理异常时,从经过Pinpoint梳理得到的项目拓扑图中,选取异常的项目节点及异常的关联关系,其中,项目拓扑图中记录有各个项目对应的项目节点及各个项目节点之间的关联关系,关联关系以两个交互的项目节点之间的有向线段表示;将各异常的项目节点及各异常的关联关系组合形成异常拓扑图;以Hotspot算法为基础,计算异常拓扑图中每一项目节点对应的根因分值;根据各项目节点对应的根因分值的大小,定位故障根因。基于此,通过计算根因分值即可更为准确地定位故障根因,提高本申请的准确性。显然,本申请可以高效且准确地定位故障根因。本申请可以高效且准确地定位故障根因。本申请可以高效且准确地定位故障根因。

【技术实现步骤摘要】
故障根因定位方法、装置、设备及可读存储介质


[0001]本申请涉及故障检测
,更具体地说,涉及一种故障根因定位方法、装置、设备及可读存储介质。

技术介绍

[0002]随着分布式系统的发展,通过分布式部署完成客户的业务请求已经越来越得到普及。通过分布式部署的方式,能够及时接收并高效地完成客户的各类业务需求。
[0003]但随着分布式部署的增多,各部署之间相互调用关系复杂,当发生故障时,运维人员需要利用大量的告警信息,从分布式部署中逐一排查故障根因。但人工排查时由于复杂的调用关系,使得排查工作量大、耗时较长。基于此,如何高效地定位故障根因成为了本领域人员关注的重点。

技术实现思路

[0004]有鉴于此,本申请提供了一种故障根因定位方法、装置、设备及可读存储介质,用于高效地定位故障根因。
[0005]为了实现上述目的,现提出的方案如下:
[0006]一种故障根因定位方法,包括:
[0007]当出现业务请求处理异常时,从经过分布式链路追踪工具Pinpoint梳理得到的项目拓扑图中,选取一个以上异常的项目节点及一个以上异常的关联关系,其中,所述项目拓扑图中记录有各个项目对应的项目节点及各个项目节点之间的关联关系,所述关联关系以两个交互的项目节点之间的有向线段表示;
[0008]将各异常的项目节点及各异常的关联关系组合形成异常拓扑图;
[0009]以根因分析算法Hotspot算法为基础,计算所述异常拓扑图中每一项目节点对应的根因分值;
[0010]根据各项目节点对应的根因分值的大小,定位故障根因。
[0011]可选的,分布式链路追踪工具Pinpoint梳理得到项目拓扑图的过程,包括:
[0012]基于Pinpoint,收集各个项目的项目信息,所述项目信息包括完成所述项目信息对应的项目所需的项目节点及关联关系;
[0013]将各个项目的项目信息写入分布式存储系统HBase;
[0014]梳理所述HBase中的各项目信息,得到项目拓扑图。
[0015]可选的,所述基于Pinpoint,收集各个项目的项目信息,包括:
[0016]在各个项目节点上打下Pinpoint探针,以供项目请求到达所述项目请求对应的项目节点时,获取所述项目节点中所述Pinpoint探针生成的所述项目请求对应的请求标识;
[0017]基于所述请求标识及Pinpoint,梳理完成所述项目请求所需的一个以上的项目节点及完成所述项目请求所需的关联关系,并将完成所述项目请求所需的一个以上的项目节点及完成所述项目请求所需的关联关系组合成项目信息。
[0018]可选的,所述以根因分析算法Hotspot算法为基础,计算所述异常拓扑图中每一项目节点对应的根因分值,包括:
[0019]基于所述异常拓扑图中每一项目节点对应的关联关系,确定所述项目节点对应的关联项目节点,并以Hotspot算法为基础,获取所述项目节点的当前访问成功率、预测访问成功率及所述项目节点对应的关联项目节点的响应成功率;
[0020]计算所述项目节点对应的变化成功率,所述变化成功率为所述当前访问成功率与所述预测访问成功率之差;
[0021]利用所述项目节点的所述预测访问成功率、所述关联项目节点的响应成功率及所述变化成功率,计算所述项目节点对应的关联项目节点的推导分值;
[0022]利用所述项目节点对应的关联项目节点的推导分值,计算所述项目节点的根因分值。
[0023]可选的,所述利用所述项目节点的所述预测访问成功率、所述关联项目节点的响应成功率及所述变化成功率,计算所述项目节点对应的关联项目节点的推导分值,包括:
[0024]计算所述变化成功率与所述关联项目节点的响应成功率之间的乘积;
[0025]计算所述乘积与所述预测访问成功率之间的比值;
[0026]基于所述比值与所述关联项目节点的响应成功率之和,确定所述项目节点对应的关联项目节点的推导分值。
[0027]可选的,所述根据各项目节点对应的根因分值的大小,定位故障根因,包括:
[0028]对各项目节点对应的根因分值进行比较,选取最大的根因分值;
[0029]将所述最大的根因分值对应的项目节点作为故障根因。
[0030]可选的,所述将各异常的项目节点及各异常的关联关系组合形成异常拓扑图,包括:
[0031]汇集各异常的项目节点及各异常的关联关系;
[0032]对汇集后的各异常的项目节点及各异常的关联关系进行去重并组合,得到异常拓扑图。
[0033]一种故障根因定位装置,包括:
[0034]选取单元,用于当出现业务请求处理异常时,从经过分布式链路追踪工具Pinpoint梳理得到的项目拓扑图中,选取一个以上异常的项目节点及一个以上异常的关联关系,其中,所述项目拓扑图中记录有各个项目对应的项目节点及各个项目节点之间的关联关系,所述关联关系以两个交互的项目节点之间的有向线段表示;
[0035]组合单元,用于将各异常的项目节点及各异常的关联关系组合形成异常拓扑图;
[0036]计算单元,用于以根因分析算法Hotspot算法为基础,计算所述异常拓扑图中每一项目节点对应的根因分值;
[0037]定位单元,用于根据各项目节点对应的根因分值的大小,定位故障根因。
[0038]一种故障根因定位设备,包括存储器和处理器;
[0039]所述存储器,用于存储程序;
[0040]所述处理器,用于执行所述程序,实现上述的故障根因定位方法的各个步骤。
[0041]一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述的故障根因定位方法的各个步骤。
[0042]从上述的技术方案可以看出,本申请提供的故障根因定位方法,当出现业务请求处理异常时,通过从经过分布式链路追踪工具Pinpoint梳理得到的项目拓扑图中,选取一个以上异常的项目节点及一个以上异常的关联关系,能够更为快捷地得到需要排查的异常项目节点及异常关联关系,其中,所述项目拓扑图中记录有各个项目对应的项目节点及各个项目节点之间的关联关系,所述关联关系以两个交互的项目节点之间的有向线段表示;将各异常的项目节点及各异常的关联关系组合形成异常拓扑图;基于此,能够将异常的关联关系及项目节点汇集得到异常拓扑图,在后续排查故障根因时,不再需要陷入复杂的调用关系中,进一步,提高定位故障根因的效率;以根因分析算法Hotspot算法为基础,计算所述异常拓扑图中每一项目节点对应的根因分值;根据各项目节点对应的根因分值的大小,定位故障根因,基于此,通过计算根因分值即可更为准确地定位故障根因,提高本申请的准确性。显然,本申请可以高效且准确地定位故障根因。
[0043]此外,本申请中通过该Pinpoint能够准确地梳理各项目节点之间的关联关系,从而得到更为可靠的、涵盖有各个项目对应的项目节点及各个项目节点之间关联关系的项目拓扑图。...

【技术保护点】

【技术特征摘要】
1.一种故障根因定位方法,其特征在于,包括:当出现业务请求处理异常时,从经过分布式链路追踪工具Pinpoint梳理得到的项目拓扑图中,选取一个以上异常的项目节点及一个以上异常的关联关系,其中,所述项目拓扑图中记录有各个项目对应的项目节点及各个项目节点之间的关联关系,所述关联关系以两个交互的项目节点之间的有向线段表示;将各异常的项目节点及各异常的关联关系组合形成异常拓扑图;以根因分析算法Hotspot算法为基础,计算所述异常拓扑图中每一项目节点对应的根因分值;根据各项目节点对应的根因分值的大小,定位故障根因。2.根据权利要求1所述的故障根因定位方法,其特征在于,分布式链路追踪工具Pinpoint梳理得到项目拓扑图的过程,包括:基于Pinpoint,收集各个项目的项目信息,所述项目信息包括完成所述项目信息对应的项目所需的项目节点及关联关系;将各个项目的项目信息写入分布式存储系统HBase;梳理所述HBase中的各项目信息,得到项目拓扑图。3.根据权利要求2所述的故障根因定位方法,其特征在于,所述基于Pinpoint,收集各个项目的项目信息,包括:在各个项目节点上打下Pinpoint探针,以供项目请求到达所述项目请求对应的项目节点时,获取所述项目节点中所述Pinpoint探针生成的所述项目请求对应的请求标识;基于所述请求标识及Pinpoint,梳理完成所述项目请求所需的一个以上的项目节点及完成所述项目请求所需的关联关系,并将完成所述项目请求所需的一个以上的项目节点及完成所述项目请求所需的关联关系组合成项目信息。4.根据权利要求1所述的故障根因定位方法,其特征在于,所述以根因分析算法Hotspot算法为基础,计算所述异常拓扑图中每一项目节点对应的根因分值,包括:基于所述异常拓扑图中每一项目节点对应的关联关系,确定所述项目节点对应的关联项目节点,并以Hotspot算法为基础,获取所述项目节点的当前访问成功率、预测访问成功率及所述项目节点对应的关联项目节点的响应成功率;计算所述项目节点对应的变化成功率,所述变化成功率为所述当前访问成功率与所述预测访问成功率之差;利用所述项目节点的所述预测访问成功率、所述关联项目节点的响应成功率及所述变化成功率,计算所述项目节点对应的关联项目节点的推导...

【专利技术属性】
技术研发人员:王风玲李佰典高保庆崔伟梁鹰
申请(专利权)人:天翼数字生活科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1