根因定位的方法和装置制造方法及图纸

技术编号:32456270 阅读:11 留言:0更新日期:2022-02-26 08:34
本说明书实施例提供了一种根因定位的方法和装置。根据该实施例的方法,获取异常系统的关键指标集和候选指标集,关键指标集包含一个以上的关键指标,候选指标集包含多于一个的候选指标;然后依据关键指标与候选指标之间的对应关系,将各关键指标分别作为待预测关键指标执行:获取异常时段内的待预测关键指标时间序列以及对应的一个以上的候选指标时间序列;利用获取的时间序列训练线性回归模型,其中线性回归模型用以利用t时刻、t

【技术实现步骤摘要】
根因定位的方法和装置


[0001]本说明书一个或多个实施例涉及人工智能
,尤其涉及一种根因定位的方法和装置。

技术介绍

[0002]根因定位(RCA,Root Cause Determination)指的是定位发生异常时哪些指标的取值导致了该异常。在很多系统庞大的业务和用户需求背景下,针对每一项服务异常,快速、准确地进行根因定位是系统产品质量的重要保障。

技术实现思路

[0003]有鉴于此,本说明书一个或多个实施例描述了一种根因定位的方法和装置,以便于快速、准确地实现根因定位。
[0004]根据第一方面,提供了一种根因定位的方法,包括:
[0005]获取异常系统的关键指标集和候选指标集,所述关键指标集包含一个以上的关键指标,所述候选指标集包含多于一个的候选指标;
[0006]依据关键指标与候选指标之间的对应关系,将各关键指标分别作为待预测关键指标执行:获取异常时段内的待预测关键指标时间序列以及对应的一个以上的候选指标时间序列;利用获取的时间序列训练线性回归模型,其中所述线性回归模型用以利用t时刻、t

1时刻的候选指标值以及t

1时刻的关键指标值,预测t时刻的关键指标值,所述t为所述异常时段内的各时刻;
[0007]对训练得到的各线性回归模型进行回归系数的筛选,利用符合预设条件的回归系数所对应的候选指标确定根因指标。
[0008]在一个实施例中,在所述利用获取的时间序列训练线性回归模型之前,还包括:
[0009]对获取的时间序列分别按照预设的时长粒度进行聚合和缺失值填充,使得获取的时间序列具有相等的步长。
[0010]在另一个实施例中,所述预设条件包括:回归系数的绝对值大于或等于预设阈值。
[0011]在一个实施例中,所述线性回归模型所采用的线性函数中对回归系数施加了最小绝对收缩和选择运算符惩罚LASSO penalty;
[0012]所述预设条件包括回归系数的值非零。
[0013]在另一个实施例中,所述关键指标集包括一个以上的租户指标,所述候选指标集包括多于一个的SQL指标。
[0014]根据第二方面,提供了一种根因定位的装置,包括:
[0015]指标获取单元,被配置为获取异常系统的关键指标集和候选指标集,所述关键指标集包含一个以上的关键指标,所述候选指标集包含多于一个的候选指标;
[0016]模型训练单元,被配置为依据关键指标与候选指标之间的对应关系,将各关键指标分别作为待预测关键指标执行:获取异常时段内的待预测关键指标时间序列以及对应的
一个以上的候选指标时间序列;利用获取的时间序列训练线性回归模型,其中所述线性回归模型用以利用t时刻、t

1时刻的候选指标值以及t

1时刻的关键指标值,预测t时刻的关键指标值,所述t为所述异常时段内的各时刻;
[0017]系数筛选单元,被配置为对训练得到的各线性回归模型进行回归系数的筛选,利用符合预设条件的回归系数所对应的候选指标确定根因指标。
[0018]在一个实施例中,该装置还包括:
[0019]序列优化单元,被配置为对所述模型训练单元获取的时间序列分别按照预设的时长粒度进行聚合和缺失值填充,使得获取的时间序列具有相等的步长供所述模型训练单元训练使用。
[0020]在另一个实施例中,所述预设条件包括:回归系数的绝对值大于或等于预设阈值。
[0021]在一个实施例中,所述线性回归模型所采用的线性函数中对回归系数施加了最小绝对收缩和选择运算符惩罚LASSO penalty;
[0022]所述预设条件包括回归系数的值非零。
[0023]在另一个实施例中,所述关键指标集包括一个以上的租户指标,所述候选指标集包括多于一个的SQL指标。
[0024]根据第三方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
[0025]根据本说明书实施例提供的方法和装置,通过训练线性回归模型的回归系数来体现在时序上各候选指标对关键指标预测的影响,进一步利用回归系数的筛选来快速、准确地实现根因定位。
附图说明
[0026]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0027]图1示出了根据一个实施例的根因定位的方法的流程图;
[0028]图2示出了根据一个实施例的根因定位装置的示意性框图;
[0029]图3示出了根据各种实施例的计算设备的结构框图。
具体实施方式
[0030]下面结合附图,对本说明书提供的方案进行描述。
[0031]传统根因定位的方式大多基于预先找到的规则,即根据经验或实验为重要的指标设置阈值来进行筛选。但这种方式筛选得到的指标数量过多,需要人工比对,来确定导致异常的根因是哪个指标。这种方式显然严重依赖人工,成本高、效率低下。
[0032]本说明书实施例的基本构思是将线性回归模型的回归系数筛选用于根因定位。
[0033]下面描述以上构思的具体实现方式。
[0034]图1示出根据一个实施例的根因定位的方法的流程图。可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。
[0035]如图1所示,该方法包括:
[0036]步骤101,获取异常系统的关键指标集和候选指标集,关键指标集包含一个以上的关键指标,候选指标集包含多于一个的候选指标。
[0037]步骤103,依据关键指标与候选指标之间的对应关系,将各关键指标分别作为待预测关键指标执行:获取异常时段内的待预测关键指标时间序列以及对应的一个以上的候选指标时间序列;利用获取的时间序列训练线性回归模型,其中线性回归模型用以利用t时刻、t

1时刻的候选指标值以及t

1时刻的关键指标值,预测t时刻的关键指标值,t为异常时段内的各时刻。
[0038]步骤105,对训练得到的各线性回归模型进行回归系数的筛选,利用符合预设条件的回归系数所对应的候选指标确定根因指标。
[0039]在图1所示的方法中,通过训练线性回归模型的回归系数来体现在时序上各候选指标对关键指标预测的影响,进一步利用回归系数的筛选来快速、准确地实现根因定位。显然相比较人工比对的方式,成本更低、效率更高。
[0040]下面描述图1所示的各个步骤的执行方式。首先结合实施例对上述步骤101即“获取异常系统的关键指标集和候选指标集”进行详细描述。
[0041]其中,异常系统指的是发生异常的系统,也就是待分析的系统。关键指标集包含一个以上的关键指标,候选指标集包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.根因定位的方法,包括:获取异常系统的关键指标集和候选指标集,所述关键指标集包含一个以上的关键指标,所述候选指标集包含多于一个的候选指标;依据关键指标与候选指标之间的对应关系,将各关键指标分别作为待预测关键指标执行:获取异常时段内的待预测关键指标时间序列以及对应的一个以上的候选指标时间序列;利用获取的时间序列训练线性回归模型,其中所述线性回归模型用以利用t时刻、t

1时刻的候选指标值以及t

1时刻的关键指标值,预测t时刻的关键指标值,所述t为所述异常时段内的各时刻;对训练得到的各线性回归模型进行回归系数的筛选,利用符合预设条件的回归系数所对应的候选指标确定根因指标。2.根据权利要求1所述的方法,其中,在所述利用获取的时间序列训练线性回归模型之前,还包括:对获取的时间序列分别按照预设的时长粒度进行聚合和缺失值填充,使得获取的时间序列具有相等的步长。3.根据权利要求1所述的方法,其中,所述预设条件包括:回归系数的绝对值大于或等于预设阈值。4.根据权利要求1所述的方法,其中,所述线性回归模型所采用的线性函数中对回归系数施加了最小绝对收缩和选择运算符惩罚LASSO penalty;所述预设条件包括回归系数的值非零。5.根据权利要求1至4中任一项所述的方法,其中,所述关键指标集包括一个以上的租户指标,所述候选指标集包括多于一个的SQL指标。6.根因定位的装置,包括:指标获取单元,被配置为获取异常系统的关键指标集和候选指标集,所述关键指标集包含一个以上的关键指标,所述候...

【专利技术属性】
技术研发人员:任少康余航张挺凯王建超李建国刘向阳
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1