基于生成对抗和双向循环神经网络的异常检测方法及装置制造方法及图纸

技术编号:34984902 阅读:37 留言:0更新日期:2022-09-21 14:29
本发明专利技术公开了基于生成对抗和双向循环神经网络的异常检测方法及装置,应用于计算机技术领域,包括对收集到的时间序列数据进行预处理,构建数据集;模型生成器模块完成初始输入数据的重构,得到生成器重构数据,并计算生成器重构误差;模型鉴别器模块完成生成器重构数据的重构,得到鉴别器重构数据,并计算鉴别器重构误差;利用生成器重构误差和鉴别器重构误差计算异常分数,并基于异常分数计算各滑动窗口对应的阈值;将滑动窗口异常分数与对应的阈值来进行异常判别。本发明专利技术能有效建模时序数据的时间依赖性,并从特征维度上放大异常,能有效提升时序数据异常检测的性能。效提升时序数据异常检测的性能。效提升时序数据异常检测的性能。

【技术实现步骤摘要】
基于生成对抗和双向循环神经网络的异常检测方法及装置


[0001]本专利技术属于计算机
,具体涉及一种基于生成对抗和双向循环神经网络的时间序列异常检测装置及方法。

技术介绍

[0002]时序数据的异常检测是数据挖掘的一个重要研究方向,在很多应用领域中都有研究。工业生产领域从监控系统运行状态的传感器中采集到的时序数据发现系统运行的异常状态,并进行异常诊断,寻找导致异常产生的根源;智能运维系统中使用异常数据检测模型自动发现运维数据中的异常模式,并根据异常类别和等级产生不同的异常告警和异常分析报告;信息安全领域通过异常检测发现系统中的异常网络流量、恶意攻击等异常行为,能够极大的提高系统的安全性。因此,可行且高效的异常检测方法至关重要。
[0003]伴随着人工智能技术的发展,时序数据的异常检测方法逐渐被分为两类,一类是传统的普通异常检测方法,包括基于距离、基于密度以及基于聚类的方法等,另一类则是基于深度学习的方法,利用复杂的神经网络来实现异常检测,由于各种深度学习异方法在异常检测领域的性能表现尤为突出且有效,能够有效的识别出时序数据中的各种异常,并且可以应对数据模式越来越复杂的问题,因此,深度学习已经成为异常检测领域的主流。
[0004]现在的深度学习方法可以通过学习历史数据的潜在特征来预测未来数据来完成异常检测,也可以通过重构正常数据来检测出异常数据,因此,针对时序数据,如何进行有效的建模时提高异常检测性能的关键。

技术实现思路

[0005]本专利技术针对现有技术的不足,提供基于生成对抗和双向循环神经网络的异常检测方法及装置,具体方案如下:基于生成对抗和双向循环神经网络的异常检测方法,包括:步骤1:对时序数据采取滑动窗口划分操作,获得包含一系列滑动窗口的三维时序数据集;步骤2:将所述三维时序数据集,经过生成器网络得出生成器重构数据,并计算三维时序数据集与生成器重构数据之间的生成器重构误差;步骤3:基于所述生成器重构数据,经过鉴别器网络得出鉴别器重构数据,并计算三维时序数据与鉴别器重构数据之间的鉴别器重构误差;步骤4:结合生成器重构误差和鉴别器重构误差计算异常分数,步骤5:基于异常分数计算每个滑动窗口对应的阈值;步骤6:将异常分数与对应阈值进行比较,判断异常。
[0006]为优化上述技术方案,采取的具体措施还包括:
步骤1中,所述的三维时序数据集为对原始时序数据进行归一化处理处理后得到的数据集。
[0007]步骤1中,原始时序数据,T表示时间,其中每个表示时序数据中时刻的值,是一个维的向量,表示维度大小,选用最大最小标准化方法的归一化处理:在完成原始数据的归一化后,对时间序列数据进行滑动窗口划分,按照时间顺序,对于时刻都往前选取长度为k的数据,进行时间戳长度为k的滑动窗口划分,每一时刻对应的窗口表示为,最终原始数据按照时间顺序被转换为一系列滑动窗口三维时序数据集,其中表示T时刻往前取k个时间戳的滑动窗口数据。
[0008]步骤2中,所述三维时序数据集通过由编码网络和解码网络构成的基于Bi

LSTM的自编码器架构得出生成器重构数据,训练完成后,编码网络将输入数据进行编码得到对应隐藏状态向量,然后解码网络利用隐藏状态向量解码出生成器重构数据,并计算生成器重构误差;并计算生成器重构误差;其中,表示生成器重构误差向量,包含了所有滑动窗口的生成器重构误差,采用均方误差损失含函数计算得出。
[0009]步骤3中,所述生成器重构数据通过编码网络和解码网络构成的基于Bi

LSTM的自编码器架构,得出鉴别器重构数据,训练完成后,编码网络将生成器重构数据进行编码得到对应隐藏状态向量,然后解码网络利用隐藏状态向量解码出鉴别器重构数据;;其中,表示生成器重构误差向量,包含了所有滑动窗口的生成器重构误差,采用均方误差损失含函数计算得出。
[0010]步骤4的异常分数的计算中,给予生成器重构误差权重比例,给予鉴别器重构误差权重比例,其中;最终中每个滑动窗口异常分数的计算方式为:其中s是一个异常分数向量,包含了所有滑动窗口的异常分数。
[0011]步骤5的所述的阈值基于异常分数计算得出,对于每个滑动窗口对应的阈值,按照时间顺序取往前l个滑动窗口的异常分数作为输入:,其中表示t时刻对应滑动窗口的异常分数,表示往前取个滑动窗口的异常分数后,个滑动窗口的
异常分数向量,采用一种非参数动态阈值选择方法来计算输出当前滑动窗口的阈值;阈值从集合中选取,阈值最终由如下公式决定中选取,阈值最终由如下公式决定中选取,阈值最终由如下公式决定中选取,阈值最终由如下公式决定,其中,表示计算中的平均值,表示计算中的标准差,Z表示一组有序的正值集合。
[0012]步骤6中,滑动窗口的异常分数,该窗口被视为异常,否则视为正常数据。
[0013]异常检测装置包括数据预处理模块、生成器重构模块、鉴别器重构模块、异常分数计算模块和阈值计算模块,其中,所述的数据预处理模块用于对原始时序数据预处理,预处理后的时序数据再采取滑动窗口划分操作,获得包含一系列滑动窗口的三维时序数据集;所述的生成器重构模块与数据预处理模块信号连接,用于重构预处理后的三维时序数据集,得出生成器重构数据,并计算三维时序数据集与生成器重构数据之间的生成器重构误差;所述的鉴别器重构模块与生成器重构模块信号连接,用于重构生成器重构数据,得出鉴别器重构数据,并计算三维时序数据集与鉴别器重构数据之间的鉴别器重构误差;所述的异常分数计算模块分别与生成器重构模块和鉴别器重构模块信号连接,用于结合生成器重构误差和鉴别器重构误差计算异常分数;所述的阈值计算模块与异常分数计算模块信号连接,用于将异常分数与对应阈值进行比较,判断异常。
[0014]异常检测装置还包括存储器,所述的存储器分别与数据预处理模块、生成器重构模块、鉴别器重构模块、异常分数计算模块和阈值计算模块信号连接,用于存储数据预处理模块、生成器重构模块、鉴别器重构模块、异常分数计算模块和阈值计算模块在运行过程中产生的数据。
[0015]本专利技术具有以下优点:本专利技术以自编码器为基础,结合生成对抗网络(Generative Adversarial Network,GAN)和双向长短期记忆神经网络(Bi

directional Long Short

Term Memory,Bi

LSTM),构建了一个异常检测重构模型,采用GAN的原理来构建模型生成器网络和鉴别器网络,生成器和鉴别器网络的构建使用了基于Bi

LSTM的自编码器架构,结合模型生成器重构误差和鉴别器重构误差计算时序数据的异常分数,并采用了一种非参数动态阈值选择方法实现异常检测,有效建模时序数据的时间依赖性,并从特征维度上放大异常,能有效提升时序数据异常检测的性能。
附图说明
[0016]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于生成对抗和双向循环神经网络的异常检测方法,其特征在于,包括:步骤1:对时序数据采取滑动窗口划分操作,获得包含一系列滑动窗口的三维时序数据集;步骤2:将所述三维时序数据集,经过生成器网络得出生成器重构数据,并计算三维时序数据集与生成器重构数据之间的生成器重构误差;步骤3:基于所述生成器重构数据,经过鉴别器网络得出鉴别器重构数据,并计算三维时序数据与鉴别器重构数据之间的鉴别器重构误差;步骤4:结合生成器重构误差和鉴别器重构误差计算异常分数,步骤5:基于异常分数计算每个滑动窗口对应的阈值;步骤6:将异常分数与对应阈值进行比较,判断异常。2.根据权利要求1所述的基于生成对抗和双向循环神经网络的异常检测方法,其特征在于,步骤1中,所述的三维时序数据集为对原始时序数据进行归一化处理处理后得到的数据集。3.根据权利要求2所述的基于生成对抗和双向循环神经网络的异常检测方法,其特征在于,所述的步骤1中,原始时序数据,T表示时间,其中每个表示时序数据中时刻的值,是一个维的向量,表示维度大小,选用最大最小标准化方法的归一化处理:在完成原始数据的归一化后,对时间序列数据进行滑动窗口划分,按照时间顺序,对于时刻都往前选取长度为k的数据,进行时间戳长度为k的滑动窗口划分,每一时刻对应的窗口表示为,最终原始数据按照时间顺序被转换为一系列滑动窗口三维时序数据集,其中表示T时刻往前取k个时间戳的滑动窗口数据。4.根据权利要求1所述的的基于生成对抗和双向循环神经网络的异常检测方法,其特征在于,步骤2中,所述三维时序数据集通过由编码网络和解码网络构成的基于Bi

LSTM的自编码器架构得出生成器重构数据,训练完成后,编码网络将输入数据进行编码得到对应隐藏状态向量,然后解码网络利用隐藏状态向量解码出生成器重构数据,并计算生成器重构误差;算生成器重构误差;其中,表示生成器重构误差向量,包含了所有滑动窗口的生成器重构误差,采用均方误差损失含函数计算得出。5.根据权利要求1所述的的基于生成对抗和双向循环神经网络的异常检测方法,其特征在于,步骤3中,所述生成器重构数据通过编码网络和解码网络构成的基于Bi

LSTM的
自编码器架构,得出鉴别器重构数据,训练完成后,编码网络将生成器重构数据进行编码得到对应隐藏状态向量,然后解码网络利用隐藏状态向量解码出鉴别器重构数据;;其中,表示生成器重构误差向量,包含了所有滑动窗口的生成器重构误差,采用均方误差损失含函数计算得出。6....

【专利技术属性】
技术研发人员:陈世伟李静段婷婷玄佳兴李伟良刘月灿杨庆甫高颖乔宇杰董小菱武秋阳李明尹晓宇饶涵宇毛冬张辰曹弯弯张敏
申请(专利权)人:国网数字科技控股有限公司国家电网有限公司信息通信分公司国网安徽省电力有限公司信息通信分公司国网浙江省电力有限公司信息通信分公司国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1