时间序列数据的异常检测方法、系统、设备和存储介质技术方案

技术编号:33206061 阅读:49 留言:0更新日期:2022-04-24 00:52
本申请涉及一种时间序列数据的异常检测方法、系统、设备和存储介质。该方法包括:采集传感器产生的时间序列数据,对时间序列数据进行归一化处理后,将时间序列数据划分为滑动窗口子序列;对每个滑动窗口子序列进行标量映射,将滑动窗口子序列进行统一的输入表示;构建异常检测模型,将滑动窗口子序列馈送到异常检测模型通过生成对抗的方式进行训练,并更新异常检测模型的参数;根据训练好的异常检测模型为新到来的待测试数据集生成异常分数,如果窗口的异常得分高于预设的异常阈值,则新到来的待测试数据集被声明为异常。该方法能够有效可以解决工业过程中时间序列数据的异常检测的问题,检测效率高效、快捷、准确。准确。准确。

【技术实现步骤摘要】
时间序列数据的异常检测方法、系统、设备和存储介质


[0001]本申请涉及神经网络领域,特别是涉及一种时间序列数据的异常检测方法、系统、设备和存储介质。

技术介绍

[0002]随着物联网、人工智能等技术的发展,传感器似乎已无处不在,其广泛应用于工业、交通、国防、科研等各个领域。在工业自动化领域,传感器是实现工业自动检测和自动控制的首要环节,大量密集使用传感器来监控其设施和系统以提高效率和安全性。因此利用这些传感器采集的数据,通过异常检测来密切监控系统的事件行为就显得尤为重要。由于传感器等硬件技术的发展,我们可以收集到越来越可靠的时间序列数据,其中时间序列异常检测是及时发现问题、规避风险的重要任务。然而随着传感器数据的复杂性和维度的增加,人类手动去监控这些数据可能会显得力不从心。
[0003]目前,关于时间序列的异常检测的主要是采用传统方法,其中传统方法其中包括聚类方法、基于密度的方法、基于距离的方法和基于隔离的方法。这些传统方法通常以相对简单的方式对时间序列数据的依赖关系进行建模。然而事实上随着维度的增加,由于维度灾难,已经达到不再允许使用这些传统方法来构造规则的复杂程度。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种时间序列数据的异常检测方法、系统、设备和存储介质。
[0005]第一方面,本专利技术实施例提供了一种时间序列数据的异常检测方法,该方法包括:
[0006]采集传感器产生的时间序列数据,对所述时间序列数据进行归一化处理后,将所述时间序列数据划分为滑动窗口子序列;
[0007]对每个所述滑动窗口子序列进行标量映射,通过可学习的全连接层将输入的标量时间戳映射为d
model
维的嵌入,将所述滑动窗口子序列进行统一的输入表示;
[0008]构建异常检测模型,将所述滑动窗口子序列馈送到所述异常检测模型通过生成对抗的方式进行训练,并更新所述异常检测模型的参数;
[0009]根据训练好的所述异常检测模型为新到来的待测试数据集生成异常分数,如果窗口的异常得分高于预设的异常阈值,则新到来的待测试数据集被声明为异常。
[0010]进一步的,所述采集传感器产生的时间序列数据,对所述时间序列数据进行归一化处理后,将所述时间序列数据划分为滑动窗口子序列,包括:
[0011]获取N个传感器在T
train
个时间步上的传感器数据,所述传感器数据构成的所述时间序列数据组成:
[0012]应用窗口大小为w和步长为h的滑动窗口将所述时间序列数据划分为一组子序列
其中是子序列的数量。
[0013]进一步的,所述对每个所述滑动窗口子序列进行标量映射,通过可学习的全连接层将输入的标量时间戳映射为d
model
维的嵌入,将所述滑动窗口子序列进行统一的输入表示,包括:
[0014]通过对每个滑动窗口进行标量映射,使用一个可学习的全连接层将输入的标量时间戳的嵌入表示从N维映射为d
model
维;
[0015]对每个滑动窗口x进行标量映射,将输入数据从N维映射为d
model
维,嵌入映射后的向量记作u
i

[0016]将所述标量映射的滑动窗口进行位置编码;
[0017]将所述标量映射的滑动窗口和进行位置编码的窗口两者加权相加,得到最终的输出即为所述输入表示。
[0018]进一步的,所述构建异常检测模型,将所述滑动窗口子序列馈送到所述异常检测模型通过生成对抗的方式进行训练,并更新所述异常检测模型的参数,包括:
[0019]通过潜在空间、生成器、鉴别器构建所述异常检测模型;其中,所述潜在空间是高斯随机噪音空间,所述生成器和鉴别器分别是改进后的Transformer神经网络;
[0020]通过嵌入层、位置编码、编码器、解码器、输出层组成所述改进后的Transformer神经网络;
[0021]由若干编码器块组成所述编码器,每个编码器块包括:多头自注意力层、逐位置的前馈神经网络、残差连接、层归一化;
[0022]使用训练好的生成器,通过将测试数据集映射回潜在空间来找到能反映测试数据集最优的潜在空间。
[0023]另一方面,本专利技术实施例还提供了一种基于时间序列数据的异常检测系统,包括:
[0024]采集处理模块,用于采集传感器产生的时间序列数据,对所述时间序列数据进行归一化处理后,将所述时间序列数据划分为滑动窗口子序列;
[0025]时序表示模块,用于对每个所述滑动窗口子序列进行标量映射,通过可学习的全连接层将输入的标量时间戳映射为d
model
维的嵌入,将所述滑动窗口子序列进行统一的输入表示;
[0026]离线训练模块,用于将所述滑动窗口子序列馈送到所述异常检测模型通过生成对抗的方式进行训练,并更新所述异常检测模型的参数;
[0027]异常检测模块,用于根据训练好的所述异常检测模型为新到来的待测试数据集生成异常分数,如果窗口的异常得分高于预设的异常阈值,则新到来的待测试数据集被声明为异常。
[0028]进一步的,所述采集处理模块包括窗口处理单元,所述窗口处理单元用于:
[0029]获取N个传感器在T
train
个时间步上的传感器数据,所述传感器数据构成的所述时间序列数据组成:
[0030]应用窗口大小为w和步长为h的滑动窗口将所述时间序列数据划分为一组子序列
其中是子序列的数量。
[0031]进一步的,所述时序表示模块包括时序计算单元,所述时序计算单元用于:
[0032]通过对每个滑动窗口进行标量映射,使用一个可学习的全连接层将输入的标量时间戳的嵌入表示从N维映射为d
model
维;
[0033]对每个滑动窗口x进行标量映射,将输入数据从N维映射为d
model
维,嵌入映射后的向量记作u
i

[0034]将所述标量映射的滑动窗口进行位置编码;
[0035]将所述标量映射的滑动窗口和进行位置编码的窗口两者加权相加,得到最终的输出即为所述输入表示。
[0036]进一步的,所述离线训练模块包括神经网络单元,所述神经网络单元用于:
[0037]通过潜在空间、生成器、鉴别器构建所述异常检测模型;其中,所述潜在空间是高斯随机噪音空间,所述生成器和鉴别器分别是改进后的Transformer神经网络;
[0038]通过嵌入层、位置编码、编码器、解码器、输出层组成所述改进后的Transformer神经网络;
[0039]由若干编码器块组成所述编码器,每个编码器块包括:多头自注意力层、逐位置的前馈神经网络、残差连接、层归一化;
[0040]使用训练好的生成器,通过将测试数据集映射回潜在空间来找到能反映测试数据集最优的潜在空间。
[0041]本专利技术实施例还提供了一种计算机本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种时间序列数据的异常检测方法,其特征在于,所述方法包括:采集传感器产生的时间序列数据,对所述时间序列数据进行归一化处理后,将所述时间序列数据划分为滑动窗口子序列;对每个所述滑动窗口子序列进行标量映射,通过可学习的全连接层将输入的标量时间戳映射为d
model
维的嵌入,将所述滑动窗口子序列进行统一的输入表示;构建异常检测模型,将所述滑动窗口子序列馈送到所述异常检测模型通过生成对抗的方式进行训练,并更新所述异常检测模型的参数;根据训练好的所述异常检测模型为新到来的待测试数据集生成异常分数,如果窗口的异常得分高于预设的异常阈值,则新到来的待测试数据集被声明为异常。2.根据权利要求1所述的时间序列数据的异常检测方法,其特征在于,所述采集传感器产生的时间序列数据,对所述时间序列数据进行归一化处理后,将所述时间序列数据划分为滑动窗口子序列,包括:获取N个传感器在T
train
个时间步上的传感器数据,所述传感器数据构成的所述时间序列数据组成:应用窗口大小为w和步长为h的滑动窗口将所述时间序列数据划分为一组子序列其中是子序列的数量。3.根据权利要求1所述的时间序列数据的异常检测方法,其特征在于,所述对每个所述滑动窗口子序列进行标量映射,通过可学习的全连接层将输入的标量时间戳映射为d
model
维的嵌入,将所述滑动窗口子序列进行统一的输入表示,包括:通过对每个滑动窗口进行标量映射,使用一个可学习的全连接层将输入的标量时间戳的嵌入表示从N维映射为d
model
维;对每个滑动窗口x进行标量映射,将输入数据从N维映射为d
model
维,嵌入映射后的向量记作u
i
;将所述标量映射的滑动窗口进行位置编码;将所述标量映射的滑动窗口和进行位置编码的窗口两者加权相加,得到最终的输出即为所述输入表示。4.根据权利要求1所述的时间序列数据的异常检测方法,其特征在于,所述构建异常检测模型,将所述滑动窗口子序列馈送到所述异常检测模型通过生成对抗的方式进行训练,并更新所述异常检测模型的参数,包括:通过潜在空间、生成器、鉴别器构建所述异常检测模型;其中,所述潜在空间是高斯随机噪音空间,所述生成器和鉴别器分别是改进后的Transformer神经网络;通过嵌入层、位置编码、编码器、解码器、输出层组成所述改进后的Transformer神经网络;由若干编码器块组成所述编码器,每个编码器块包括:多头自注意力层、逐位置的前馈神经网络、残差连接、层归一化;使用训练好的生成器,通过将测试数据集映射回潜在空间来找到能反映测试数据集最优的潜在空间。
5.一种基于时间序列数...

【专利技术属性】
技术研发人员:刘金平汪家喜徐鹏飞蔡美玲谢永明马天雨郑之伟王靖超
申请(专利权)人:湖南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1