【技术实现步骤摘要】
一种物联网时序数据异常检测方法及系统
本专利技术涉及时序数据检测领域,特别是涉及一种物联网时序数据异常检测方法及系统。
技术介绍
随着各种领域数字化的普及,许多配备传感器的设备产生了大量的时间数据,形成时间序列。这类时间序列产生广泛,在许多应用领域都有应用,如金融、生物、交通和医疗保健等。在各种领域,如预测性维护、入侵检测、防欺诈、云平台监控与管理等许多现实应用中,时间序列的异常检测是必需的。时间序列异常检测的研究由来已久。然而,由于时间序列在真实环境下的多样化、时间序列标注标签的高成本等原因,传统算法都无法获得令人满意的有效性与泛用性。随着近年来深度学习技术的不断进步,相较于传统算法,深度学习可以更好地学习到时间序列数据中的空间、时间依赖性,更加适合处理时间序列的异常检测问题。在物联网时序数据异常检测时,通常采用无监督的时序数据异常检测方法和有监督的时序数据异常检测方法。自编码器算法是时间序列异常检测的一个常用无监督算法。自编码器算法使用只包含正常样本的训练数据进行模型训练,学习了正常样本的概率分布,并对此 ...
【技术保护点】
1.一种物联网时序数据异常检测方法,其特征在于,包括:/n获取待测试的物联网时序数据;/n对所述待测试的物联网时序数据进行划分得到待测试时间序列数据段集;/n将所述待测试时间序列数据段集输入至训练好的半监督自编码模型中,得到检测结果;所述训练好的半监督自编码模型是以待训练的物联网时序数据为输入,以对应的类标签为输出,以损失函数最小为目标对基于LSTM和注意力机制的半监督自编码器模型进行训练得到的;所述待训练的物联网时序数据包括无标记的物联网时序数据和有标记的物联网时序数据。/n
【技术特征摘要】 【专利技术属性】
1.一种物联网时序数据异常检测方法,其特征在于,包括:
获取待测试的物联网时序数据;
对所述待测试的物联网时序数据进行划分得到待测试时间序列数据段集;
将所述待测试时间序列数据段集输入至训练好的半监督自编码模型中,得到检测结果;所述训练好的半监督自编码模型是以待训练的物联网时序数据为输入,以对应的类标签为输出,以损失函数最小为目标对基于LSTM和注意力机制的半监督自编码器模型进行训练得到的;所述待训练的物联网时序数据包括无标记的物联网时序数据和有标记的物联网时序数据。
2.根据权利要求1所述的一种物联网时序数据异常检测方法,其特征在于,所述将所述待测试时间序列数据段集输入至训练好的半监督自编码模型中,得到检测结果,具体包括:
将所述待测试时间序列数据段集输入至训练好的半监督自编码模型中,得到待测试时间序列数据段集的重构数据;
基于所述重构数据,计算所述待测试时间序列数据段集中各待测试时间序列数据段的重构误差;
当所述重构误差大于设定阈值时,将对应的待测试时间序列数据段确定为异常样本;当所述重构误差小于或等于设定阈值时,将对应的待测试时间序列数据段确定为正常样本。
3.根据权利要求1所述的一种物联网时序数据异常检测方法,其特征在于,所述损失函数为
其中,xu为无标记的物联网时序数据;x′u为xu经过基于LSTM和注意力机制的半监督自编码器模型重构后的样本数据;为有标记的物联网时序数据中的正常样本数据;为有标记的物联网时序数据中的异常样本数据;为经过基于LSTM和注意力机制的半监督自编码器模型重构后的样本数据;为经过基于LSTM和注意力机制的半监督自编码器模型重构后的样本数据;η为有标记的物联网时序数据在损失函数中占的权重。
4.根据权利要求1所述的一种物联网时序数据异常检测方法,其特征在于,在所述获取待测试的物联网时序数据之后,还包括:
采用min-max标准化对所述待测试的物联网时序数据进行归一化处理。
5.根据权利要求1所述的一种物联网时序数据异常检测方法,其特征在于,所述对所述待测试的物联网时序数据进行划分得到待测试时间序列数据段集,具体包括:
采用滑动窗口对所述待测试的物联网时序数据进行划分得到待测试时间序列数据段集。
技术研发人员:关东海,肖辉,袁伟伟,陈兵,屠要峰,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。