当前位置: 首页 > 专利查询>中山大学专利>正文

一种针对多元时间序列的主动异常检测方法及其相关装置制造方法及图纸

技术编号:32974300 阅读:9 留言:0更新日期:2022-04-09 11:48
本申请公开了一种针对多元时间序列的主动异常检测方法及其相关装置,通过KPI数据无监督训练异常检测模型,得到无监督异常检测模型;当获取到新的KPI数据时,通过滑动窗口对新的KPI数据进行处理,得到多个时间序列样本,通过无监督异常检测模型对各时间序列样本进行异常检测,得到各时间序列样本在对应的时间观测点的异常分数;根据各时间序列样本的异常分数选择若干时间序列样本进行标签标注,得到若干有标签的时间序列样本;通过各时间序列样本的标签信息反馈训练无监督异常检测模型,得到最终异常检测模型;通过最终异常检测模型对待检测KPI数据进行异常检测,改善了现有的无监督异常检测模型存在的误报率和漏检率较高的技术问题。技术问题。技术问题。

【技术实现步骤摘要】
一种针对多元时间序列的主动异常检测方法及其相关装置


[0001]本申请涉及数据处理
,尤其涉及一种针对多元时间序列的主动异常检测方法及其相关装置。

技术介绍

[0002]在云原生系统异常检测的任务中,每时每刻都有新的KPI数据产生,很难对KPI数据逐一人工标记来建立一个有效的有监督异常检测模型。用于缺少标签,许多无监督的异常检测方法不断被提出。然而,无监督异常检测方法的误报率和漏检率往往高于有监督异常检测方法。当软件系统随着连续的集成和部署而频繁更新时,KPI数据的分布也会发生变化,异常检测模型的准确性会不可避免地继续下降。

技术实现思路

[0003]本申请提供了一种针对多元时间序列的主动异常检测方法及其相关装置,用于改善现有的无监督异常检测模型存在的误报率和漏检率较高的技术问题。
[0004]有鉴于此,本申请第一方面提供了一种针对多元时间序列的主动异常检测方法,包括:
[0005]获取云原生系统的KPI数据,并通过所述KPI数据无监督训练异常检测模型,得到无监督异常检测模型;
[0006]当获取到新的KPI数据时,通过滑动窗口对所述新的KPI数据进行处理,得到多个时间序列样本,并通过所述无监督异常检测模型对各所述时间序列样本进行异常检测,得到各所述时间序列样本在对应的时间观测点的异常分数;
[0007]根据各所述时间序列样本的异常分数选择若干时间序列样本进行标签标注,得到若干有标签的时间序列样本;
[0008]通过各时间序列样本的标签信息反馈训练所述无监督异常检测模型,得到最终异常检测模型;
[0009]通过所述最终异常检测模型对待检测KPI数据进行异常检测。
[0010]可选的,所述无监督异常检测模型为变分自动编码器,所述无监督异常检测模型在无监督训练过程中的损失函数由重构损失和正则化项构成。
[0011]可选的,各所述时间序列样本在对应的时间观测点的异常分数的计算过程为:
[0012]对各所述时间序列样本在对应的时间观测点的损失值进行指数加权移动平均,得到各所述时间序列样本在对应的时间观测点的异常分数。
[0013]可选的,所述根据各所述时间序列样本的异常分数选择若干时间序列样本进行标签标注,得到若干有标签的时间序列样本,包括:
[0014]对各所述时间序列样本的异常分数进行降序排序,选择前若干个时间序列样本作为第一目标样本;
[0015]选择分数阈值前后若干个时间序列样本作为第二目标样本;
[0016]根据各所述时间序列样本的异常分数进行分数区间划分,得到若干个分数区间,在各分数区间随机选择若干个时间序列样本作为第三目标样本;
[0017]对所述第一目标样本、所述第二目标样本和所述第三目标样本进行标签标注,得到若干有标签的时间序列样本。
[0018]可选的,所述通过各时间序列样本的标签信息反馈训练所述无监督异常检测模型,得到最终异常检测模型,包括:
[0019]根据所述有标签的时间序列样本的异常分数和无标签的时间序列样本的异常分数获取所述无标签的时间序列样本的伪标签;
[0020]根据各时间序列样本的标签信息,通过第一目标函数反馈训练所述无监督异常检测模型,得到最终异常检测模型,其中,所述第一目标损失函数为:
[0021]L
active
=L
recon
+L
KL

m
L
metric

[0022]L
metric
=L
intra
+λL
inter

[0023]式中,L
active
为第一目标损失函数,L
recon
为重构损失,L
KL
为正则化项,L
metric
为反馈训练过程中的度量损失,L
intra
为类内损失,L
inter
为类间损失,λ为类间损失的权重系数,λ
m
为度量损失的权重系数。
[0024]可选的,所述根据所述有标签的时间序列样本的异常分数和无标签的时间序列样本的异常分数获取所述无标签的时间序列样本的伪标签,包括:
[0025]计算所述有标签的时间序列样本中的正常样本的异常分数均值,得到第一均值,计算所述有标签的时间序列样本中的异常样本的异常分数均值,得到第二均值;
[0026]计算各所述无标签的时间序列样本的异常分数与所述第一均值的第一绝对差值,计算各所述无标签的时间序列样本的异常分数与所述第二均值的第二绝对差值;
[0027]通过比较各所述无标签的时间序列样本的第一绝对差值和第二绝对差值的大小,获取各所述无标签的时间序列样本的伪标签。
[0028]可选的,所述通过各时间序列样本的标签信息反馈训练所述无监督异常检测模型,得到最终异常检测模型,包括:
[0029]根据各时间序列样本的标签信息,通过第二目标损失函数反馈训练所述无监督异常检测模型,得到最终异常检测模型,所述第二目标损失函数为:
[0030][0031]或,
[0032][0033]式中,L
active
为第二目标损失函数,为第i个无标签的时间序列样本的重构损失,为第i个无标签的时间序列样本的正则化项,n为无标签的时间序列样本的数量,为第j个有标签的时间序列样本的重构损失,为第j个有标签的时间序列样本的正则化项,m为有标签的时间序列样本的数量,为第j个有标签的时间序列样本的标签值,η、η

为超参数。
[0034]本申请第二方面提供了一种针对多元时间序列的主动异常检测装置,包括:
[0035]无监督训练单元,用于获取云原生系统的KPI数据,并通过所述KPI数据无监督训练异常检测模型,得到无监督异常检测模型;
[0036]第一检测单元,用于当获取到新的KPI数据时,通过滑动窗口对所述新的KPI数据进行处理,得到多个时间序列样本,并通过所述无监督异常检测模型对各所述时间序列样本进行异常检测,得到各所述时间序列样本在对应的时间观测点的异常分数;
[0037]标注单元,用于根据各所述时间序列样本的异常分数选择若干时间序列样本进行标签标注,得到若干有标签的时间序列样本;
[0038]反馈训练单元,用于通过各时间序列样本的标签信息反馈训练所述无监督异常检测模型,得到最终异常检测模型;
[0039]第二检测单元,用于通过所述最终异常检测模型对待检测KPI数据进行异常检测。
[0040]本申请第三方面提供了一种针对多元时间序列的主动异常检测设备,所述设备包括处理器以及存储器;
[0041]所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
[0042]所述处理器用于根据所述程序代码中的指令执行第一方面任一种所述的针对多元时间序列的主动异常检测方法。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对多元时间序列的主动异常检测方法,其特征在于,包括:获取云原生系统的KPI数据,并通过所述KPI数据无监督训练异常检测模型,得到无监督异常检测模型;当获取到新的KPI数据时,通过滑动窗口对所述新的KPI数据进行处理,得到多个时间序列样本,并通过所述无监督异常检测模型对各所述时间序列样本进行异常检测,得到各所述时间序列样本在对应的时间观测点的异常分数;根据各所述时间序列样本的异常分数选择若干时间序列样本进行标签标注,得到若干有标签的时间序列样本;通过各时间序列样本的标签信息反馈训练所述无监督异常检测模型,得到最终异常检测模型;通过所述最终异常检测模型对待检测KPI数据进行异常检测。2.根据权利要求1所述的针对多元时间序列的主动异常检测方法,其特征在于,所述无监督异常检测模型为变分自动编码器,所述无监督异常检测模型在无监督训练过程中的损失函数由重构损失和正则化项构成。3.根据权利要求2所述的针对多元时间序列的主动异常检测方法,其特征在于,各所述时间序列样本在对应的时间观测点的异常分数的计算过程为:对各所述时间序列样本在对应的时间观测点的损失值进行指数加权移动平均,得到各所述时间序列样本在对应的时间观测点的异常分数。4.根据权利要求1所述的针对多元时间序列的主动异常检测方法,其特征在于,所述根据各所述时间序列样本的异常分数选择若干时间序列样本进行标签标注,得到若干有标签的时间序列样本,包括:对各所述时间序列样本的异常分数进行降序排序,选择前若干个时间序列样本作为第一目标样本;选择分数阈值前后若干个时间序列样本作为第二目标样本;根据各所述时间序列样本的异常分数进行分数区间划分,得到若干个分数区间,在各分数区间随机选择若干个时间序列样本作为第三目标样本;对所述第一目标样本、所述第二目标样本和所述第三目标样本进行标签标注,得到若干有标签的时间序列样本。5.根据权利要求1所述的针对多元时间序列的主动异常检测方法,其特征在于,所述通过各时间序列样本的标签信息反馈训练所述无监督异常检测模型,得到最终异常检测模型,包括:根据所述有标签的时间序列样本的异常分数和无标签的时间序列样本的异常分数获取所述无标签的时间序列样本的伪标签;根据各时间序列样本的标签信息,通过第一目标函数反馈训练所述无监督异常检测模型,得到最终异常检测模型,其中,所述第一目标损失函数为:L
active
=L
recon
+L
KL

m
L
metric
;L
metric
=L
intra
+λL
inter
;式中,L
active
为第一目标损失函数,L
recon
为重构损失,L
KL
为正则化项,L
metric
为反馈训练过程中的度量损失,L
intra
为类内损失...

【专利技术属性】
技术研发人员:陈鹏飞王雯麓郑子彬
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1