一种无监督学习的电池生产工艺异常波动检测方法技术

技术编号:33894081 阅读:33 留言:0更新日期:2022-06-22 17:30
本发明专利技术公开了一种无监督学习的电池生产工艺异常波动检测方法,本发明专利技术提出的特征融合重建网络中编码器网络通过多层卷积操作对输入的多通道特征矩阵进行空间上的特征提取。ConvLSTM网络提取输入的多通道特征矩阵序列在不同时间步长中的时间特征,完成数据的特征捕捉,同时在此基础上添加的注意力机制可以完成权重分配,将更多的注意力权重分配给关键的特征并减少噪声的干扰。通过译码器网络可以解码在上一步获得的特征映射,同时,利用特征矩阵信息的非对称能力来构造特征提取矩阵,从而增强各层之间的特征重用性。分层特征融合模型增加各层之间的特征交互,使得模型能够感知更多的特征维度和时间维度的信息。多的特征维度和时间维度的信息。多的特征维度和时间维度的信息。

【技术实现步骤摘要】
一种无监督学习的电池生产工艺异常波动检测方法


[0001]本专利技术涉及工业生产工艺波动分析领域,具体涉及一种无监督学习的工艺波动的异常检测方法。

技术介绍

[0002]随着物联网和传感器技术的发展,工业生产中记录了大量的高维传感器数据,用来监测设备的运行状态。作为监控设备状态的一种重要方式,时间序列数据的异常检测在城市资源管理、计算机网络入侵检测、医疗保健和工业生产中得到了广泛关注。但是,通过传感器采集的数据多数是正常状态,而异常数据由于难以获得而较少,这就增加了异常检测的负担。如何通过现有的技术完成异常点检测,从而提高工业生产工艺波动分析的效率,减低生产设备的运行和维护成本具有重大的应用价值。
[0003]传统的异常点检测方法包括基于距离的方法和基于分类的方法。其中,一类支持向量机算法为基于距离方法的代表算法,通过对训练数据进行建模,从而区分出数据中的正常点和异常点。虽然该方法能够有效地解决数据的区分,但是该方法只关注了数据的本身信息,没有对时间序列的相关性进行捕捉,使得效果不佳。另一种方法是基于分类的方法,如隔离森林,该方法通过随机选择特征进行二叉树的搭建,从而完成时间序列的异常点检测,此方法需要耗费大量的时间进行特征设计和预处理,导致检测效果不稳定。
[0004]针对传统的异常点检测方法的缺点,基于深度学习的方法大量涌现出来,其中长短期记忆网络(Long Short

Term Memory,LSTM)是处理时间序列的典型深度学习模型之一。基于LSTM模型的数据异常点检测方法,主要是预测下一个时间步长内的数据,并计算预测数据与真实数据之间的距离,通过距离的大小进而判断该时间点的是否出现异常。LSTM模型可以学习短期或长期时间序列数据中的非线性关系,但是对于噪声非常的敏感,从而增加了异常检测中的误分类风险。
[0005]综上所述,在处理电池生产过程工艺波动分析问题中,寻找一种有效的时间序列异常检测的方法,以替代现有的技术,成为了目前亟需解决的问题。

技术实现思路

[0006]本专利技术提出一种基于无监督学习的电池生产工艺异常波动检测方法,分层特征融合重建网络HFFRN(Hierarchical Feature Fusion Reconstruction Network),算法流程图如图1所示,该算法可以实现电池生产过程中工艺波动的异常检测的功能。
[0007]本专利技术的技术方案包括如下步骤:
[0008]1)数据采集:通过安装在电池生产设备上的传感器,采集生产过程中工艺参数的时间序列,建立数据集;
[0009]2)数据处理:将原始数据集划分为训练集X
train
、验证集X
val
、测试集X
test
,其中X
train
中只包含正常的样本,X
val
和X
test
中包含正常和异常的样本;对于每个数据集处理后,生成多通道特征矩阵M;
[0010]3)搭建HFFRN模型,并使用训练集X
train
对模型进行训练;
[0011]搭建HFFRN模型,具体构建步骤如下:
[0012]HFFRN模型包含CNN

ConvLSTM

ATTENTION网络,模型的第一层由4层二维卷积层组成编码层,每个二维卷积层都包含二维卷积2D

Conv、批次归一化层BN以及泄露修正线性单元LRelu激活函数;通过接收与工艺相关的多通道特征矩阵序列,选择不同的卷积核的权重和窗口的宽度,4层2D

Conv逐层提取特征矩阵的空间特征,完成空间特征的编码,每层的输出作为下层中间层的输入;中间层由四个并行的ConvLSTM块组成,用于捕获多通道特征矩阵序列中的时间和空间两个维度上的特征,同时在此基础上引入注意力机制;注意力机制完成权重的分配,将更多注意力权重分配给关键特征并减少干扰;解码层由4个二维反卷积层组成,每层均包含二维反卷积2D

Deconv、批次归一化层BN以及泄露修正线性单元LRelu激活函数;二维反卷积2D

Deconv作为2D

Conv的逆过程,通过调整卷积步长即可还原特征图特征信息;反卷积运算从最后一层反向解码到第一层,提取每一层的特征矩阵;对于最后一层直接通过对ConvLSTM的输出进行反卷积运算得到特征提取矩阵;其余三层通过将本层ConvLSTM的输出与i+1层的特征提取矩阵进行拼接之后再进行反卷积运算,得到本层的特征提取矩阵;特征提取矩阵用如下的公式进行表示:
[0013][0014]其中,c1,c2,c3,c4为每块ConvLSTM的输出,代表反卷积操作,代表串联操作,W
dei
和b
dii
分给为第i层中反卷积核的权重和偏置;
[0015]分层特征融合层中通过4个并行的二维卷积2D

Conv将特征提取矩阵转换成四个维度和大小相同的特征矩阵,公式如下:
[0016]p
i
=f(W
rei
*r
i
+b
rei
) i=1,2,3,4 (2)
[0017]其中,p
i
为维度和大小相同的特征矩阵,W
rei
为卷积核的权重,b
rei
为卷积核的偏置;
[0018]之后将这四个特征矩阵输入到联络层进行拼接;最后通过使用一个2
×
2的卷积核对特征矩阵中的特征值进行信息融合,得到融合特征矩阵,也即最终需要的重构特征矩阵,重构特征矩阵表示为:
[0019]O=f([p1;p2;p3;p4]*W+b) (3)
[0020]其中,O为重构特征矩阵,W为卷积核的权重,b为卷积核的偏置;[p1;p2;p3;p4]表示将p1、p2、p3和p4进行拼接;
[0021]4)使用验证集X
val
用于验证已训练好的网络模型,并通过使用一种完全自适应的最佳阈值确定机制,寻找合适的阈值T;
[0022]使用一种完全自适应的最佳阈值确定机制,寻找合适的阈值T,对异常得分进行划分,异常得分在该阈值以下的为正常点,反之为异常点;具体步骤如下:
[0023]由于模型是使用正常的样本训练的,所以对于正常的样本模型实现很好的重构,验证集X
val
的数据中既有正常数据又有异常数据,重构时会产生较大的误差,通过以下公式表示异常得分:
[0024]ε=||O

M||
2 (4)
[0025]其中,|| ||表示L2范数;
[0026]将在验证集X
val
得到的异常得分ε1,ε2,...,ε
n
按照升序的顺序进行排序,得到新的异常得分为假设最佳阈值为T,使得当异常得分ε本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种无监督学习的电池生产工艺异常波动检测方法,其特征在于,该方法具体包括以下步骤:1)数据采集:通过安装在电池生产设备上的传感器,采集生产过程中工艺参数的时间序列,建立数据集;2)数据处理:将原始数据集划分为训练集X
train
、验证集X
val
、测试集X
test
,其中X
train
中只包含正常的样本,X
val
和X
test
中包含正常和异常的样本;对于每个数据集处理后,生成多通道特征矩阵M;3)搭建HFFRN模型,并使用训练集X
train
对模型进行训练;搭建HFFRN模型,具体构建步骤如下:HFFRN模型包含CNN

ConvLSTM

ATTENTION网络,模型的第一层由4层二维卷积层组成编码层,每个二维卷积层都包含二维卷积2D

Conv、批次归一化层BN以及泄露修正线性单元LRelu激活函数;通过接收与工艺相关的多通道特征矩阵序列,选择不同的卷积核的权重和窗口的宽度,4层2D

Conv逐层提取特征矩阵的空间特征,完成空间特征的编码,每层的输出作为下层中间层的输入;中间层由四个并行的ConvLSTM块组成,用于捕获多通道特征矩阵序列中的时间和空间两个维度上的特征,同时在此基础上引入注意力机制;注意力机制完成权重的分配,将更多注意力权重分配给关键特征并减少干扰;解码层由4个二维反卷积层组成,每层均包含二维反卷积2D

Deconv、批次归一化层BN以及泄露修正线性单元LRelu激活函数;二维反卷积2D

Deconv作为2D

Conv的逆过程,通过调整卷积步长即可还原特征图特征信息;反卷积运算从最后一层反向解码到第一层,提取每一层的特征矩阵;对于最后一层直接通过对ConvLSTM的输出进行反卷积运算得到特征提取矩阵;其余三层通过将本层ConvLSTM的输出与i+1层的特征提取矩阵进行拼接之后再进行反卷积运算,得到本层的特征提取矩阵;特征提取矩阵用如下的公式进行表示:其中,c1,c2,c3,c4为每块ConvLSTM的输出,代表反卷积操作,代表串联操作,W
dei
和b
dii
分给为第i层中反卷积核的权重和偏置;分层特征融合层中通过4个并行的二维卷积2D

Conv将特征提取矩阵转换成四个维度和大小相同的特征矩阵,公式如下:p
i
=f(W
rei
*r
i
+b
rei
)i=1,2,3,4
ꢀꢀꢀ
(2)其中,p
i
为维度和大小相同的特征矩阵,W
rei
为卷积核的权重,b
rei
为卷积核的偏置;之后将这四个特征矩阵输入到联络层进行拼接;最后通过使用一个2
×
2的卷积核对特征矩阵中的特征值进行信息融合,得到融合特征矩阵,也即最终需要的重构特征矩阵,重构特征矩阵表示为:O=f([p1;p2;p3;p4]*W+b)
ꢀꢀꢀ
(3)其中,O为重构特征矩阵,W为卷积核的权重,b为卷积核的偏置;[p1;p2;p3;p4]表示将p1、...

【专利技术属性】
技术研发人员:何志伟赵宾杰官思伟董哲康高明煜
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1