【技术实现步骤摘要】
一种异常时序数据检测方法、设备及介质
[0001]本专利技术涉及数据处理领域,尤其涉及一种异常时序数据检测方法、设备及介质。
技术介绍
[0002]智能控制系统监控是对系统可测量事件和输出的监督过程,用作指定系统正常功能的参考。分析与历史正常数据的偏差,以确定是否存在遗产。在以往,这种分析是由系统监控专家完成的,他们为每个测量的输出建立正常的行为阈值。如果监测量超过对应的阈值,则认为系统发生了运行异常。随着工业控制系统越来越复杂,获得测量数据所需的传感器数量急剧增加,传统的基于专家定义阈值的方法不再适用。在这种情况下,实现智能控制系统监测的自动化已成为一种必要。自动化的智能控制系统监测需要开发一些方法来观察传感器获得的不同测量值,并从这些方法中推断出正常和异常的行为。
[0003]在一组多维时间序列上进行监测称为多元时间序列中的异常检测。在过去的几年中,已经发展了许多方法来解决这个问题。最常用的技术包括基于距离的技术,如k
‑
最近邻,聚类,如k
‑
means,或者用单类SVM进行分类。然而,随着智能控制系统的进步具有较高复杂性,不适用这些方法。基于深度学习的无监督异常检测方法能够推断时间序列之间的相关性,从而识别异常行为,该方法被迁移到异常时序检测技术中。在检测时间数据异常的深度学习方法中,基于递归神经网络(RNNs)的方法是非常流行的。然而,众所周知,递归神经网络所占用的内存和耗时是巨大的。因而,需要设计一种高效且适用实际场景的异常时序检测方法。
技术实现思路
r/>[0004]为了克服上述技术缺陷,本专利技术的目的在于提供一种异常时序数据检测方法、设备及介质,解决现有基于递归神经网络进行异常时序检测,网络结构复杂,内存和耗时较大,效率较低的问题。
[0005]本专利技术公开了一种异常时序数据检测方法,包括:
[0006]建立初始模型,并采用训练数据集对所述初始模型进行训练;其中,所述初始模型包括编码模块、第一解码模块、第二解码模块、预测模块、惩罚模块;
[0007]获取所述训练数据集中任一训练数据,将所述训练数据输入至所述初始模型;
[0008]在所述初始模型中,采用编码模块对所述训练数据进行时序特征提取,获得特征表示;
[0009]采用第一解码模块对所述特征表示进行数据重建,获得第一处理数据;
[0010]所述第一处理数据依次通过所述编码模块和所述第二解码模块进行数据重建,获得第二处理数据;
[0011]采用预测模块基于所述特征表示进行时序预测,获得训练数据的预测值与实际值之间的预测误差;
[0012]采用惩罚模块基于所述特征表示计算最大均值差异惩罚;
[0013]采用所述计算模块根据训练数据、第一处理数据、第二处理数据、预测误差以及最大均值差异惩罚计算训练输出;
[0014]迭代训练,对所述初始模型中损失函数进行调整,直至完成训练,获得目标模型;
[0015]获得目标数据,采用所述目标模型对所述目标数据处理后根据预设函数计算时序得分,以获得目标检测结果。
[0016]优选地,根据所述第二处理数据与所述训练数据计算第二重建误差;
[0017]所述训练包括第一训练阶段和第二训练阶段,在第一训练阶段调整以最小化所述第二重建误差,在第二训练阶段调整以最大化所述第二重建误差。
[0018]优选地,所述采用编码模块对所述训练数据进行时序特征提取,获得特征表示,包括:
[0019]采用门控循环单元对所述训练数据进行在时间维度下特征提取,获得第一输出数据;
[0020]采用多元Resnet模块对所述第一输出处理,获得包含训练数据对应的空间特征的第二输出数据;
[0021]将所述第二输出数据通过一全连接层,对所述训练数据对应空间特征映射以获得所述特征表示。
[0022]优选地,所述采用多元Resnet对所述第一输出数据处理,获得包含训练数据对应的空间特征的第二输出数据,包括:
[0023]基于所述第一输出数据进行尺寸重塑,以获得多个尺寸的特征图;
[0024]分别通过三个Resnet模块和池化层对各个尺寸的特征图进行处理后,进行维度拼接,以获得训练数据对应的空间特征,作为第二输出数据。
[0025]优选地,所述采用第一解码模块对所述特征表示进行数据重建,获得第一处理数据,包括:
[0026]采用一全连接层对所述特征表示进行特征映射,获得第一中间数据;
[0027]将所述第一中间数据输入至多元Resnet模块重构空间特征,获得第二中间数据;
[0028]采用门控循环单元对所述第二中间数据处理,获得第一处理数据。
[0029]优选地,所述第二解码模块与所述第一解码模块结构一致;
[0030]所述第二解码模块与所述第一解码模块并联。
[0031]优选地,所述基于所述特征表示进行时序预测,获得训练数据的预测值与实际值之间的预测误差,包括:
[0032]在预测模块中,采用串联的两个全连接层对所述特征表示进行处理,以基于T个时间步的特征获得T+1时刻的预测数据,获得训练数据中各个时刻下预测值与实际值之间的差值,以生成预测误差。
[0033]优选地,所述采用所述计算模块根据训练数据、第一处理数据、第二处理数据、预测误差以及最大均值差异惩罚计算训练输出,包括:
[0034]根据所述训练数据与第一处理数据计算第一重建误差,根据所述训练数据与第二处理数据计算第二重建误差;
[0035]对所述第一重建误差、所述第二重建误差、预测误差以及最大均值差异惩罚分别以预设权重加权并加和,以生成训练输出。
[0036]本专利技术还提供一种计算机设备,所述计算机设备包括:
[0037]存储器,用于存储可执行程序代码;以及
[0038]处理器,用于调用所述存储器中的所述可执行程序代码,执行步骤包括所述的异常时序数据检测方法。
[0039]本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,
[0040]所述计算机程序被处理器执行时实现所述异常时序数据检测方法的步骤。
[0041]采用了上述技术方案后,与现有技术相比,具有以下有益效果:
[0042]本申请中提供的异常时序数据检测方法,对多元时序数据本身的特性,建立基于多元Resnet和GRU的自编码机构的神经网络,改进模型架构,捕获时序数据的时空特征,增加特征约束,提高对异常数据的敏感度,以无监督的方式进行训练模型后用于检测,减少内存消耗,提高检测效率。
附图说明
[0043]图1为本专利技术所述一种异常时序数据检测方法实施例一的流程图;
[0044]图2为本专利技术所述一种异常时序数据检测方法实施例一中初始模型的网络结构示意图;
[0045]图3为本专利技术所述计算机设备的模块示意图。
[0046]附图标记:
[0047]9‑
计算机设备;91
‑...
【技术保护点】
【技术特征摘要】
1.一种异常时序数据检测方法,其特征在于,包括:建立初始模型,并采用训练数据集对所述初始模型进行训练;其中,所述初始模型包括编码模块、第一解码模块、第二解码模块、预测模块、惩罚模块;获取所述训练数据集中任一训练数据,将所述训练数据输入至所述初始模型;在所述初始模型中,采用编码模块对所述训练数据进行时序特征提取,获得特征表示;采用第一解码模块对所述特征表示进行数据重建,获得第一处理数据;所述第一处理数据依次通过所述编码模块和所述第二解码模块进行数据重建,获得第二处理数据;采用预测模块基于所述特征表示进行时序预测,获得训练数据的预测值与实际值之间的预测误差;采用惩罚模块基于所述特征表示计算最大均值差异惩罚;迭代训练,对所述初始模型中损失函数进行调整,直至完成训练,获得目标模型;获得目标数据,采用所述目标模型对所述目标数据处理后根据预设函数计算时序得分,以获得目标检测结果。2.根据权利要求1所述的检测方法,其特征在于:根据所述第二处理数据与所述训练数据计算第二重建误差;所述训练包括第一训练阶段和第二训练阶段,在第一训练阶段调整以最小化所述第二重建误差,在第二训练阶段调整以最大化所述第二重建误差。3.根据权利要求1所述的检测方法,其特征在于:所述采用编码模块对所述训练数据进行时序特征提取,获得特征表示,包括:采用门控循环单元对所述训练数据进行在时间维度下特征提取,获得第一输出数据;采用多元Resnet模块对所述第一输出处理,获得包含训练数据对应的空间特征的第二输出数据;将所述第二输出数据通过一全连接层,对所述训练数据对应空间特征映射以获得所述特征表示。4.根据权利要求3所述的检测方法,其特征在于,所述采用多元Resnet对所述第一输出数据处理,获得包含训练数据对应的空间特征的第二输出数据,包括:基于所述第一输出数据进行尺寸重塑,以获得多个尺寸的特征图;分别通过三个Resnet模...
【专利技术属性】
技术研发人员:李才博,闻金鸿,王迅,吴斌,
申请(专利权)人:昭通亮风台信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。