多维度指标的异常根因定位方法及系统技术方案

技术编号:37469935 阅读:15 留言:0更新日期:2023-05-06 09:49
本申请实施例提供一种多维度指标的异常根因定位方法及系统。方法包括:所述方法包括:对KPI指标进行预测,基于预测结果判断KPI指标是否存在异常;确定异常KPI指标,获取异常KPI指标对应的Cuboid信息;对各Cuboid执行剪枝算法:在每一层剪枝下,分别计算各Cuboid中各元素的根因可能性指标,并基于各Cuboid中各元素的根因可能性指标进行多余Cuboid剪枝,直到确定剪枝得到的Cuboid是最细粒度的元素,停止剪枝算法,将保留的Cuboid作为候选根因集合;分别计算所述候选根因集合中各候选根因的评价指标,对比各候选根因的评价指标计算结果,基于对比结果定位最优候选根因作为异常根因。本发明专利技术方案实现了多维度指标中的异常根因快速且准确地定位。且准确地定位。且准确地定位。

【技术实现步骤摘要】
多维度指标的异常根因定位方法及系统


[0001]本申请涉及服务器运维
,具体涉及一种多维度指标的异常根因定位方法及一种多维度指标的异常根因定位系统。

技术介绍

[0002]在企业运行过程中,会存在大量的运维数据,特别是金融业或互联网业企业,在企业正常运转过程中会产生大量的运维数据,这些运维数据涉及了企业相关产业过程中的各项指标信息,当某一项指标产生异常时,需要基于对应的运维数据识别到产生异常的最细粒度原因。多维度指标的异常根因定位最主要的难点在于运维中的指标维度多、每个维度取值范围大,导致异常定位时的搜索空间非常大,根因定位极其困难。目前,主要应用的方法为将多维根因分析问题分解为多个单维根因分析问题,采用EP值和S值定位出每个维度下异常元素集合,最后根据每个维度总的S值大小输出根因集合。这种方式依旧存在定位准确性差、定位速度慢和内部波动数据大的表现差的问题,且不存在其他可以改善的方案,基于此,需要创造一种新的多维度指标的异常根因定位方法。

技术实现思路

[0003]本申请实施例的目的是提供一种多维度指标的异常根因定位方法、多维度指标的异常根因定位系统、存储介质及计算机程序产品,以解决现有方法存在的定位准确性差、定位速度慢和内部波动数据大的表现差的问题。
[0004]为了实现上述目的,本申请第一方面提供一种多维度指标的异常根因定位方法,所述方法包括:对KPI指标进行预测,基于预测结果判断KPI指标是否存在异常;确定异常KPI指标,获取异常KPI指标对应的Cuboid信息;对各Cuboid执行剪枝算法:在每一层剪枝下,分别计算各Cuboid中各元素的根因可能性指标,并基于各Cuboid中各元素的根因可能性指标进行多余Cuboid剪枝,直到确定剪枝得到的Cuboid是最细粒度的元素,停止剪枝算法,将保留的Cuboid作为候选根因集合;分别计算所述候选根因集合中各候选根因的评价指标,对比各候选根因的评价指标计算结果,基于对比结果定位最优候选根因作为异常根因。
[0005]在本申请实施例中,采用加权移动平均方法对当前KPI指标进行预测。
[0006]在本申请实施例中,所述方法还包括:提取出历史运维数据中的KPI指标真实值;所述基于预测结果判断KPI指标是否存在异常,包括:将KPI指标的预测结果与历史运维数据中对应的KPI指标真实值进行对比,若二者之间的差值大于预设异常差值阈值,则判定KPI指标存在异常。
[0007]在本申请实施例中,在提取出历史运维数据中的KPI指标真实值后,所述方法还包括:对提取的KPI指标真实值进行预处理,包括:进行无效数据删除和缺失数据填充;提取KPI指标真实值中的细粒度KPI指标作为该KPI指标下的元素。
[0008]在本申请实施例中,获取异常KPI指标对应的Cuboid信息,包括:根据细粒度KPI指
标确定对应的维度数量;基于所述维度数量确定对应的Cuboid数量,并确定各Cuboid中各元素信息;其中,所述Cuboid数量的确定规则为:
[0009]M=2
N

1;
[0010]其中,M为Cuboid数量;N为维度数量。
[0011]在本申请实施例中,所述分别计算各Cuboid中各元素的根因可能性指标,包括:将所有Cuboid整合作为待剪枝Cuboid集合,分别计算各Cuboid中各元素的预测值;对于每一Cuboid,基于其中各元素的预测值和对应的各元素的真实值,分别计算各候选根因的第一评价指标和第二评价指标;基于各候选根因的第一评价指标和第二评价指标计算获得对应元素的根因可能性指标。
[0012]在本申请实施例中,所述第一评价指标为元素的余弦相似度值,所述第二评价指标为元素的贡献度;其中,所述余弦相似度值为将对应元素作为可能根因计算获得的元素预测值与实际值之间的可能根因余弦相似度值;所述贡献度为将对应元素作为可能根因计算获得的元素的变化量对总变化量的贡献大小。
[0013]在本申请实施例中,所述可能根因余弦相似度值计算规则为:将元素的真实值和预测值分别进行向量处理,获得元素的真实值向量和预测值向量;
[0014]基于所述元素的真实值向量和预测值向量进行可能根因余弦相似度值计算,计算式为:
[0015][0016]其中,cos(θ)为可能根因余弦相似度值;xi为元素的真实值向量;yi为元素的预测值向量;i为元素序号。
[0017]在本申请实施例中,所述元素的贡献度的计算规则为:
[0018][0019]其中,contribute
score
为元素的贡献度;v(x)为元素的真实值;f(x)为元素的预测值;V为异常KPI的总变化量;F为异常KPI的预测总变化量。
[0020]在本申请实施例中,所述基于各Cuboid中各元素的根因可能性指标进行多余Cuboid剪枝,包括:获得同一层维度下所有Cuboid的根因可能性指标;对比各层维度的根因可能性指标,确定根因可能性指标最大的维度,将该维度下所有Cuboid中的根因可能性指标最大的元素整合获得第一可能根因集合,对所述第一可能根因集合中各元素进行根因可能性指标大小降序排列,保留其中前N个元素对应的Cuboid作为第二可能根因集合,将其余元素对应的Cuboid进行剪枝删除。
[0021]在本申请实施例中,所述直到确定剪枝得到的Cuboid是最细粒度的元素,停止剪枝算法,包括:若确定一层剪枝得到的Cuboid非最细粒度的元素,则将该层剪枝获得的第二可能根因集合作为待剪枝的Cuboid集合;对新的待剪枝的Cuboid集合再次执行剪枝,直到确定剪枝得到的Cuboid是最细粒度的元素,停止剪枝算法。
[0022]在本申请实施例中,所述分别计算所述候选根因集合中各候选根因的评价指标,
包括:计算候选根因的第一评价指标和第二评价指标,并计算该候选根因的第三评价指标和第四评价指标;其中,所述第三评价指标为可能根因实际值与预测值之间的皮尔逊相关系数;所述第四评价指标为可能根因实际值与预测值之间的变化;基于所述第一评价指标、所述第二评价指标、所述第三评价指标和所述第四评价指标计算获得综合评价指标作为该候选根因的评价指标。
[0023]在本申请实施例中,所述计算候选根因的第三评价指标,包括:将候选根因的真实值和预测值分别进行向量处理,获得该候选根因的真实值向量和预测值向量;基于该候选根因的真实值向量和预测值向量进行可能根因皮尔逊相关系数计算,计算式为:
[0024][0025]其中,ρ为可能根因皮尔逊相关系数;xi为候选根因的真实值向量;yi为候选根因的预测值向量;为真实值平均值;为预测值平均值。
[0026]在本申请实施例中,所述计算候选根因的第四评价指标,包括:分别计算候选根因中各元素的变化量实际值与变化量预测值之间的第一变化率;计算该候选根因的总变化量实际值与总变化量预测值之间的第二变化率;分别对比各候选根因的第一变化率与第二变化率;统计各候选根因中第一变化率大于第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多维度指标的异常根因定位方法,其特征在于,所述方法包括:对KPI指标进行预测,基于预测结果判断KPI指标是否存在异常;确定异常KPI指标,获取异常KPI指标对应的Cuboid信息;对各Cuboid执行剪枝算法:在每一层剪枝下,分别计算各Cuboid中各元素的根因可能性指标,并基于各Cuboid中各元素的根因可能性指标进行多余Cuboid剪枝,直到确定剪枝得到的Cuboid是最细粒度的元素,停止剪枝算法,将保留的Cuboid作为候选根因集合;分别计算所述候选根因集合中各候选根因的评价指标,对比各候选根因的评价指标计算结果,基于对比结果定位最优候选根因作为异常根因。2.根据权利要求1所述的方法,其特征在于,采用加权移动平均方法对当前KPI指标进行预测。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:提取出历史运维数据中的KPI指标真实值;所述基于预测结果判断KPI指标是否存在异常,包括:将KPI指标的预测结果与历史运维数据中对应的KPI指标真实值进行对比,若二者之间的差值大于预设异常差值阈值,则判定KPI指标存在异常。4.根据权利要求1所述的方法,其特征在于,在提取出历史运维数据中的KPI指标真实值后,所述方法还包括:对提取的KPI指标真实值进行预处理,包括:进行无效数据删除和缺失数据填充;提取KPI指标真实值中的细粒度KPI指标作为该KPI指标下的元素。5.根据权利要求4所述的方法,其特征在于,获取异常KPI指标对应的Cuboid信息,包括:根据细粒度KPI指标确定对应的维度数量;基于所述维度数量确定对应的Cuboid数量,并确定各Cuboid中各元素信息;其中,所述Cuboid数量的确定规则为:M=2
N

1;其中,M为Cuboid数量;N为维度数量。6.根据权利要求1所述的方法,其特征在于,所述分别计算各Cuboid中各元素的根因可能性指标,包括:将所有Cuboid整合作为待剪枝Cuboid集合,分别计算各Cuboid中各元素的预测值;对于每一Cuboid,基于其中各元素的预测值和对应的各元素的真实值,分别计算各候选根因的第一评价指标和第二评价指标;基于各候选根因的第一评价指标和第二评价指标计算获得对应元素的根因可能性指标。7.根据权利要求6所述的方法,其特征在于,所述第一评价指标为元素的余弦相似度值,所述第二评价指标为元素的贡献度;其中,所述余弦相似度值为将对应元素作为可能根因计算获得的元素预测值与实际值之间的可能根因余弦相似度值;
所述贡献度为将对应元素作为可能根因计算获得的元素的变化量对总变化量的贡献大小。8.根据权利要求7所述的方法,其特征在于,所述可能根因余弦相似度值计算规则为:将元素的真实值和预测值分别进行向量处理,获得元素的真实值向量和预测值向量;基于所述元素的真实值向量和预测值向量进行可能根因余弦相似度值计算,计算式为:其中,cos(θ)为可能根因余弦相似度值;xi为元素的真实值向量;yi为元素的预测值向量;i为元素序号。9.根据权利要求7所述的方法,其特征在于,所述元素的贡献度的计算规则为:其中,contribute
score
为元素的贡献度;v(x)为元素的真实值;f(x)为元素的预测值;V为异常KPI的总变化量;F为异常KPI的预测总变化量。10.根据权利要求1所述的方法,其特征在于,所述基于各Cuboid中各元素的根因可能性指标进行多余Cuboid剪枝,包括:获得同一层维度下所有Cuboid的根因可能性指标;对比各层维度的根因可能性指标,确定根因可能性指标最大的维度,将该维度下所有Cuboid中的根因可能性指标最大的元素整合获得第一可能根因集合,对所述第一可能根因集合中各元素进行根因可能性指标大小降序排列,保留其中前N个元素对应的Cuboid作为第二可能根因集合,将其余元素对应的Cuboid进行剪枝删除。11.根据权利要求10所述的方法,其特征在于,所述直到确定剪枝得到的Cuboid是最细粒度的元素,停止剪枝算法,包括:若确定一层剪枝得到的Cuboid非最细粒度的元素,则将该层剪枝获得的第二可能根因集合作为待剪枝的Cuboid集合;对新的待剪枝的Cuboid集合再次执行剪枝,直到确定剪枝得到的Cuboid是最细粒度的元素,停止剪枝算法。12.根据权利要求7所述的方法,其特征在于,所述分别计算所述候选根因集合中各候选根因的评价指标,包括:计算候选根因的第一评价指标和第二评价指标,并计算该候选根因的第三评价指标和第四评价指标;其中,
所述第三评价指标为可能根因实际值与预测值之间的皮尔逊相关系数;所述第四评价指标为可能根因...

【专利技术属性】
技术研发人员:丁萍范先爽李超吴迪
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1