一种基于生成模型的LSTM多变量时间序列异常检测方法技术

技术编号:35737600 阅读:27 留言:0更新日期:2022-11-26 18:40
本发明专利技术公开了一种基于生成模型的LSTM多变量时间序列异常检测方法,涉及复杂设备的高维数据异常检测领域。本发明专利技术针对数据集不平衡或缺少数据标签的场景,提出DG

【技术实现步骤摘要】
一种基于生成模型的LSTM多变量时间序列异常检测方法
[0001]所属领域
[0002]本专利技术涉及系统可靠性领域,更具体的涉及复杂设备的高维数据异常检测领域。
现有技术
[0003]近年来,伴随着数字化革命向各个领域的加速渗透,设备迎来了数字化转型,通过不同种类的传感器对振动、电流、电压、温度、应力等设备信息进行数据采集和状态监测,由此产生了大量的多变量时间序列数据。并且随着物联网、人工智能、计算机等新一代信息技术的发展,设备数据的维数和容量还将会进一步增大。为了更全面的监测设备的工作状态,保障设备运行过程中的可靠性、安全性,降低因设备故障带来的经济损失,对设备数据进行准确、及时的多变量时间序列异常检测技术研究十分必要。然而,过去的设备异常检测技术多针对于单变量的时间序列异常检测,检测时仅考虑某一个特定指标对系统健康状态的影响,缺乏对多个指标的综合判断,使得检测结果产生误报的可能性增加,从而影响了检测结果的准确率。
[0004]在机器学习中,维度是指数据集中特征的数量,当数据集的特征数量过多时,会影响模型训练的有效性,从而带来维度灾难的问题。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于生成模型的LSTM多变量时间序列异常检测方法,其特征在于,包括如下步骤:步骤1:数据预处理,包括如下子步骤:步骤1.1:数据标准化:采用两种方法对不同特征集进行标准化,当传感器数据随时间变化时,采用零

均值规范化方法(即Z

Score标准化)进行标准化操作,对于序列x1,x2,

,x
n
,标准化转换公式如下:此式中,和s分别为训练集变量的均值和标准差,由此得到标准化后新的序列数据y1,y2,

,y
n
。当传感器数据恒定不变时,我们采用下式进行标准化操作:步骤1.2:数据标签标定:对于每一个待测设备,规定运行周期中的正常采样数据作为正常数据进行训练;根据先前工作研究所得出的数据集阈值先验知识,将检测出的退化变点以后的数据标记为异常,以此进行算法评估。步骤1.3:数据集划分:将待测设备数据集按合适的比例进行划分,对应得到其训练集、验证集、测试集;步骤1.4:数据切片采用滑动窗口的方法对数据集进行切片处理,将某个点的检测转化为对点所在区间的检测;步骤2:DG

MTAD算法实现异常检测步骤2.1:DG

MTAD算法模型训练DG

MTAD算法模型由编码器E、生成器G以及3个鉴别器D1,D2,D3组成,生成器G实现隐空间中的随机噪声Z向真实样本数据空间中生成样本G(Z)的映射;编码器E将真实样本X编码为隐空间的高效表示E(X),从而实现不同空间下的双向学习过程。在模型训练阶段,首先将真实序列数据输入到编码器E中,同时将隐空间中的随机噪声数据输入到生成器G中,然后将编码器E与生成器G的输入、输出结果分别进行组合,一同输入到鉴别器D1中进行判断,此外,算法模型中还增加了鉴别器D2和鉴别器D3,以实现对生成器和编码器输出结果的进一步约束。其中鉴别器D2的输入是生成器G的输出和真实样本X,鉴别器D3的输入是编码器E的输出样本和隐空间的随机噪声。通过多轮的对抗训练最小化鉴别器的输入数据差异,最终在获得足够敏感的鉴别器模型参数的同时,使得编码器与生成器能够生成与目标输出尽可能相似的数据来“欺骗”鉴别器。DG

【专利技术属性】
技术研发人员:陈绍炜温鹏飞赵帅徐芳达陈雨含王诗音
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1