一种多维数据的异常检测方法、装置及电子设备制造方法及图纸

技术编号:33717071 阅读:27 留言:0更新日期:2022-06-08 21:07
本发明专利技术实施例提供了一种多维数据的异常检测方法、装置及电子设备,该方法包括:获取待测的多维序列,所述多维序列包括预设维度的参数;将所述待测的多维序列输入到预置的异常检测模型,输出得到所述待测的多维序列是否满足模型标准,并根据与各参数对应的阈值区间,判断所述待测的多维序列中是否存在不满足对应阈值区间的参数;其中,所述异常检测模型为,以所述多维序列的历史数据为训练数据通过孤立森林算法训练得到的;在所述待测的多维序列不满足所述模型标准,且存在不满足对应阈值区间的参数时,判定所述待测的多维序列异常。通过本发明专利技术实施例,实现了准确识别多维序列中的异常序列。常序列。常序列。

【技术实现步骤摘要】
一种多维数据的异常检测方法、装置及电子设备


[0001]本专利技术涉及移动通信
,尤其涉及一种多维数据的异常检测方法、装置及电子设备。

技术介绍

[0002]异常检测也称为离群检测,用于发现数据流中的异常类型并确定其发生的详细信息。但是随着移动通信的发展,整个互联网业务急剧膨胀,为了适配多种终端、不同接入方式,运行场景日趋复杂,各类监控指标繁多且数据量巨大,海量多维序列数据给运维人员带来更高的挑战。
[0003]现有的异常检测方法多为单指标异常检测,即单维序列异常检测,通常假设数据变化满足一种分布,如高斯分布或者正态分布来计算动态阈值,对数据按照一定的规律波动来判断异常是否有效,判别速度快。但是一旦数据在某一段时间变化幅度加大,数据不够平滑,这种动态阈值的方式就会导致很多的错判和漏判。对于多指标(多维序列)数据来说,时间复杂度和空间复杂度会更高,无效和干扰信息更加严重。若每个指标进行单指标的异常检测,太多的维度以及数据量就会导致速度变慢,累积更多的错判和漏判,很难发现相关联的异常指标数据,不利于整体分析问题。<br/>[0004]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多维数据的异常检测方法,其特征在于,所述方法包括:获取待测的多维序列,所述多维序列包括预设维度的参数;将所述待测的多维序列输入到预置的异常检测模型,输出得到所述待测的多维序列是否满足模型标准,并根据与各参数对应的阈值区间,判断所述待测的多维序列中是否存在不满足对应阈值区间的参数;其中,所述异常检测模型为,以所述多维序列的历史数据为训练数据通过孤立森林算法训练得到的;在所述待测的多维序列不满足所述模型标准,且存在不满足对应阈值区间的参数时,判定所述待测的多维序列为异常序列。2.根据权利要求1所述的多维数据的异常检测方法,其特征在于,在所述获取待测的多维序列的步骤之前,所述方法还包括:根据所述多维序列在第一时间区间内的历史数据,通过预设的阈值计算方法,获取与各参数对应的阈值区间;根据所述多维序列在第二时间区间内的历史数据,通过所述预设的孤立森林算法,构建所述异常检测模型;其中,所述第二时间区间比所述第一时间区间更接近于当前时刻。3.根据权利要求2所述的多维数据的异常检测方法,其特征在于,所述根据所述多维序列在第一时间区间内的历史数据,通过预设的阈值计算方法,获取与各参数对应的阈值区间,包括:按照预设的时间划片规则,建立与各时间片段对应的多维序列组;将所述多维序列在第一时间区间内的历史数据,根据各历史数据的采样时间,将各历史数据划分到对应的多维序列组;在所述多维序列组内,通过预设的阈值计算方法,获取参数在对应的时间片段内的阈值区间;所述根据与各参数对应的阈值区间,判断所述待测的多维序列中是否存在不满足对应阈值区间的参数,包括:根据与所述待测的多维序列的采样时间对应的时间片段,得到各参数在所述时间片段内的阈值区间,并判断所述待测的多维序列中是否存在不满足对应阈值区间的参数。4.根据权利要求3所述的多维数据的异常检测方法,其特征在于,所述在所述多维序列组内,通过预设的阈值计算方法,获取参数在对应的时间片段内的阈值区间,包括:在所述多维序列组内,通过预设的格拉布斯离群数据检测算法,对各参数进行数据清洗;根据清洗后保留的参数,得到各参数在对应的时间片段内的阈值区间。5.根据权利要求4所述的多维数据的异常检测方法,其特征在于,在判定所述待测的多维序列异常的步骤后,所述方...

【专利技术属性】
技术研发人员:王锐郑浩彬段新孙剑骏林纲温粉莲庞健
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1