【技术实现步骤摘要】
一种异常检测方法及相关装置
[0001]本申请涉及异常检测
,特别是涉及一种异常检测方法及相关装置。
技术介绍
[0002]目前,在多维时间序列数据异常检测的场景下,常用的异常检测方法的效果不佳,尤其是基于距离的异常检测算法,该类方法通常认为点的分部密度低的位置是异常点的可能性较大,但该类算法主要依赖的是距离的定义,目前定义距离的方法主要由欧式距离、编辑距离等,但该类距离定义方法在多维时间序列数据异常检测的场景下是不适用的,因为欧氏距离没有考虑维度之间的关系,而编辑距离也仅能够衡量单维的距离,该类方法扩展到多维场景下的效果较差,在扩展到高维时间序列数据时,情况会变得较为复杂,因此除了单个数据点外,我们还需考虑数据点之间存在的短暂依赖(temporary dependence)。因此,异常检测在多维时间序列场景下难以进行。
[0003]可见,如何进行多维时间序列场景下的异常检测,成为本领域亟需解决的技术问题。
技术实现思路
[0004]基于上述问题,本申请提供了一种异常检测方法及相关装置,能够较为 ...
【技术保护点】
【技术特征摘要】
1.一种异常检测方法,其特征在于,所述方法包括:对多维时间序列数据进行预处理;利用编码器的网络模型对预处理后的多维时间序列数据进行处理,得到嵌入空间向量;获取单类别检测损失函数;基于所述嵌入空间向量以及所述损失函数对模型进行训练;利用训练后的模型进行异常检测,得到异常检测结果。2.根据权利要求1所述的方法,其特征在于,所述单类别检测损失函数包括:其中,S
p
为样例;Q
s
为正常数据的疑问样例数据集;Q
o
为异常数据的疑问样例数据集;为通过神经网络学习的嵌入函数;φ为神经网络要学习的参数集;α为用来平衡两个距离权重的参数;为衡量两个向量相似度的距离方法。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取无标签数据集;利用所述嵌入函数获取所述无标签数据集中每个数据的置信值;将所述无标签数据集中预设比例的高置信值数据添加到训练集中以对模型继续训练。4.根据权利要求1所述的方法,其特征在于,所述对多维时间序列数据进行预处理,包括:对多维时间序列数据进行分段处理;使用随机维度排列对分段后的多维时间序列数据中不同维度之间的特征进行提取;对分段后的多维时间序列数据进行短时傅里叶变换,得到所述分段后的多维时间序列数据对应的频域信号。5.根据权利要求4所述的方法,其特征在于,所述对多维时间序列数据进行分段处理,包括:获取多维时间序列数据;将所述多维时间序列数据在保留预设覆盖率的前提下进行分段。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述嵌入空间向量中添加多维度的注意力,以对所述嵌入空间向量进行更新;所述基于所述嵌入空间向量以及损失函数对...
【专利技术属性】
技术研发人员:冯珺,彭梁英,王红凯,黄建平,陈浩,李钟煦,沈思琪,雷舒娅,刘赫,董洪达,
申请(专利权)人:国网浙江省电力有限公司信息通信分公司国网智能电网研究院有限公司国网吉林省电力有限公司电力科学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。