当前位置: 首页 > 专利查询>南京大学专利>正文

一种用于微服务应用程序的故障根因定位方法技术

技术编号:32189592 阅读:30 留言:0更新日期:2022-02-08 15:54
本发明专利技术提供了一种用于微服务应用程序的故障根因定位方法,包括:步骤1,通过调用接口的方式从监控系统中每隔一段时间进行各种指标数据信息的采集;步骤2,对获取到的sKPI时间序列数据的有效性进行检验,如果检验为无效数据,则剔除该时间点数据或者重新获取数据;如果检测为有效数据,则进入步骤3;步骤3,使用基于核函数的异常检测器EXPoSE在线检测ESB的sKPI异常,并获得故障的发生时间T_fault;步骤4,计算网元节点间调用耗时的推土机(wasserstein)距离,提取mKPI的突变特征;步骤5,利用随机森林关联模型预测根因节点和根因mKPI。mKPI。mKPI。

【技术实现步骤摘要】
一种用于微服务应用程序的故障根因定位方法


[0001]本专利技术涉及故障根因定位
,尤其涉及一种用于微服务应用程序的故障根因定位方法。

技术介绍

[0002]为了保证微服务系统的可靠性,监控系统会定期收集两类指标。服务级指标sKPI,如调用耗时;机器级性能指标mKPI,如CPU使用率、网络发送队列等指标。这些监控指标有助于工程师在系统发生故障时诊断性能并定位故障根本原因。真实场景下故障根本原因定位是困难的。由于微服务系统模块众多,系统的组件之间有复杂的相互作用,并且微服务系统有多种不同的故障原因,可以分为外部故障和内部故障。前者包括硬件故障、网络崩溃、资源占用过载等,后者主要是指软件故障。
[0003]参见图1,图中给出的是传统的用于微服务故障根因定位方法,包括以下步骤:1.通过3

sigma(数据在μ

3σ,μ+3σ之外,σ代表标准差,μ代表均值)检验单一的sKPI序列来确定故障时间T_fault;2.判断在T_fault附近是否为数据库(db)错误,若是则输出db故障网元和故障指标;3.本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于微服务应用程序的故障根因定位方法,其特征在于,包括如下步骤:步骤1,通过调用接口的方式从监控系统中每隔时间X进行各种指标数据信息的采集,所述各种指标数据信息包括总体服务级指标sKPI,网元节点之间调用耗时数据M
i,j
(r),以及各种机器级性能指标数据mKPI;步骤2,通过hive聚集统计系统总体服务级指标sKPI,对当前t时刻数据进行实时有效性检验,如果检验为无效数据,则剔除当前t时刻数据或者重新获取数据,得到t时刻总体服务级指标sKPI的取值向量x
t
;如果检测为有效数据,则保存数据x
t
,进入步骤3;步骤3,使用基于核函数的异常检测器EXPoSE在线检测系统总线所有服务级指标sKPI的异常分数,并获得故障的发生时间T
fault
;步骤4,计算网元节点间调用耗时的推土机距离,提取机器性能级别特征的突变特征;步骤5,利用随机森林关联模型预测故障根因节点和根因mKPI。2.根据权利要求1所述的方法,其特征在于,步骤3包括:通过以下公式计算异常分数s
t
::是对x
t
进行特征映射,所有映射都是基于高斯核函数;μ[P
t
]是核均值映射,3.根据权利要求2所述的方法,其特征在于,步骤3中,根据得到的异常分数,设定阈值θ,当t和t+1时刻的异常分数均大于阈值θ,则判断t时刻为故障发生时刻。4.根据权利要求3所述的方法,其特征在于,步骤4中,采用如下方法计算网元节点的推土机距离:每次预测到故障发生时间T
fault
后,开始计算:设置t=T
fault
,设置窗口w,对于网元节点i和j:对所有x设置其中,x表示故障时间t之前的时间窗内网元节点之间耗时数据M
i,j
(r),x是随机变量;r是故障时间t前时间窗的开始时间;表示网元节点耗时随机变量的分布;表示随机变量x的指示函数;对所有x设置对所有x设置表示故障后时间窗内节点耗时的分布情况;计算网元节点i、j间的推土机距离s
i,j
(T
fault
):其中,Π(P,Q)表示所有可能...

【专利技术属性】
技术研发人员:刘帆王雪卢非池史鑫博陈智颖马煜王元兰
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1