当前位置: 首页 > 专利查询>西北大学专利>正文

一种融合AVAE和SE模块的图像异常检测方法技术

技术编号:39395672 阅读:9 留言:0更新日期:2023-11-19 15:50
本发明专利技术公开了一种融合AVAE和SE模块的图像异常检测方法:步骤1,获取需进行异常检测的图像数据,并对其进行预处理,将预处理后的数据划分训练集及测试集;步骤2,采用训练集对图像异常检测模型进行训练,得到训练好的图像异常检测模型;所述图像异常检测模型包括基于注意力机制的变分自编码器、SE模块和判别器,判别器连接到基于注意力机制的变分自编码器的输出端,基于注意力机制的变分自编码器包括编码器和解码器,SE模块连接在编码器和解码器之间;步骤3,将待检测的图像预处理后导入训练好的图像异常检测模型中得到异常分数。本发明专利技术的方法对实际工业环境下图像数据进行异常检测很有效。很有效。很有效。

【技术实现步骤摘要】
一种融合AVAE和SE模块的图像异常检测方法


[0001]本专利技术属于工业图像异常检测
,具体涉及一种融合AVAE和SE模块的图像异常检测方法。

技术介绍

[0002]工业图像异常检测是在制造业领域中广泛应用的一项关键技术。随着制造业的数字化和信息化的快速发展,大量的图像数据被采集和记录,这些数据包含了工业生产过程中的各种细节和特征。通过对这些图像数据进行异常检测,可以及时发现生产过程中的异常情况,帮助企业提高产品质量、减少生产风险和损失。随着技术的不断发展,工业图像异常检测将迎来更广阔的应用前景,为工业生产带来更大的价值和创新。工业图像数据具有复杂性和多样性,因此,开发出有效的异常检测方法对于确保生产过程的稳定性和可靠性至关重要。
[0003]现代计算机视觉技术和机器学习算法为工业图像异常检测提供了强大的工具和方法。首先,通过使用计算机视觉技术,可以对工业图像进行预处理和特征提取。这包括图像去噪、图像增强、边缘检测、纹理分析等操作,以提取出图像中的关键特征。这些特征可以反映出工业生产过程中的正常情况,并与异常情况进行对比。
[0004]其次,机器学习算法在工业图像异常检测中发挥着重要作用。常用的机器学习算法包括支持向量机(SVM)、随机森林(Random Forest)、卷积神经网络(Convolutional Neural Networks,CNN)等。这些算法可以通过对已标记的正常和异常图像进行训练,学习到正常图像的特征和模式,并根据新的未知图像进行分类和异常判断。
[0005]目前通常采用VAE模型进行图像异常检测,其是一种生成模型,可以从输入数据中学习潜在变量,并生成新的样本。对于正常数据,该模型可以很好地重构输入数据;而对于异常数据,由于其分布与正常数据不同,模型往往很难重构输入数据,从而产生较大的重构误差。因此,通过设置一个重构误差的阈值可以将重构误差超过该阈值的数据识别为异常数据。但是,VAE模型更倾向于生成模糊或模棱两可的样本,这是由于其生成过程是随机的,且无法保证每个样本都是高质量的,因此检测准确性低。

技术实现思路

[0006]本专利技术的目的在于提出一种融合AVAE和SE模块的图像异常检测方法,以解决现有工业图像异常检测技术中存在的检测准确性低的技术问题。
[0007]为了实现上述目的,本专利技术采用如下技术方案:
[0008]一种融合AVAE和SE模块的图像异常检测方法,具体包括以下步骤:
[0009]步骤1,获取需进行异常检测的图像数据,并对其进行预处理,将预处理后的数据划分训练集及测试集;
[0010]步骤2,采用训练集对图像异常检测模型进行训练,得到训练好的图像异常检测模型;所述图像异常检测模型包括基于注意力机制的变分自编码器、SE模块和判别器,判别器
连接到基于注意力机制的变分自编码器的输出端,基于注意力机制的变分自编码器包括编码器和解码器,SE模块连接在编码器和解码器之间;
[0011]步骤3,将待检测的图像进行预处理,然后导入步骤2训练好的图像异常检测模型中得到异常分数,作为异常检测结果。
[0012]进一步的,所述编码器采用多个卷积层和多个自注意机制模块交叉叠加得到。
[0013]进一步的,所述编码器中包括3个卷积层和3个自注意力机制模块。
[0014]进一步的,所述SE模块包括依次连接的压缩模块、激励模块和scale操作;所述压缩模块包括全局平均池化层,所述激励模块包括依次连接的FC层、ReLU激活函数、FC层和Sigmoid激活函数。
[0015]进一步的,所述解码器采用多个反卷积层和多个自注意机制模块交叉叠加后再连接一个Sigmoid激活函数得到。
[0016]进一步的,所述解码器中包括3个反卷积层和3个自注意力机制模块。
[0017]进一步的,步骤2中,所述图像异常检测模型的重构损失函数为:
[0018]L
total
=L
BCE
+L
KLD
[0019]其中,L
BCE
是BCE损失函数,L
KLD
是KLD损失函数。
[0020]进一步的,在所述编码器中的卷积层和注意力机制模块之间加入有正则化项,在所述解码器中的反卷积层和注意力机制模块之间加入有正则化项。
[0021]相较于现有技术,本专利技术具有如下有益效果:
[0022]1、编码器采用多层卷积,能够增强模型对图像等二维数据的特征学习能力,并提高模型的泛化性能。卷积操作能够高效地处理图像数据的空间结构,减少参数量,提供平移不变性,并增加非线性表达能力。
[0023]2、在编码器和解码器中均加入了自注意力机制,使隐层特征进行增强,使模型更加关注重要特征、捕捉全局或长程依赖关系、提升特征表示能力,提高了模型的准确性和生成样本的质量,增强特征交互的灵活性和自适应性,改善生成样本的一致性,并提升模型对抗攻击的鲁棒性。并帮助模型自适应地学习特征的重要性。
[0024]3、编码器部分包含多个用于提取输入图像隐层特征的卷积层,并在卷积层后加上自注意力机制,提高全局信息的编码和提取,改进隐变量采样过程,并增强模型的解释性。
[0025]4、在AVAE中的编码器和解码器之间加入了SE模块,进一步增强了模型对输入数据中各个通道的关注程度和特征表达能力,提高特征的区分性和泛化能力,更好的重建图像,有助于更好的提高异常检测的准确率。SE模块的激励模块选取ReLU作为激活函数,且在最后加上Sigmoid激活函数,其具有非线性映射、输出概率解释和平滑梯度传播等优点,使得神经网络能够学习和表示复杂的非线性关系,并在二分类任务中输出概率值,同时减少梯度消失和梯度爆炸问题,同时,SE模块具有可嵌入性,易于实现和解释,同时能够提高生成样本的质量和多样性。
[0026]5、为防止模型过拟合和约束模型参数,在基于注意力机制的变分自编码器中,在编码器的卷积层和解码器的反卷积层后分别加入了正则化项(Dropout),通过随机失活神经元来减少神经网络的过拟合,并提高网络的泛化能力和鲁棒性,用于防止模型过拟合和约束模型参数。再接入到自注意力机制,让模型可以更好地重建图像。
[0027]6、模型的最小化损失函数由BCE损失和KLD损失两部分组成,通过最小化重构损失
试图使解码器能够恢复成原始数据,从而实现重构的目标,同时学习潜在空间表示,使编码器生成的隐变量接近先验分布;以及通过KL散度损失对潜在空间进行正则化,提高模型的泛化能力和可解释性。
附图说明
[0028]附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。
[0029]图1为本专利技术中的AVAE编码器架构图;
[0030]图2为本专利技术中融合的SE模型结构图;
[0031]图3为本专利技术中的AVAE解码器架构图;
[0032]图4为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合AVAE和SE模块的图像异常检测方法,其特征在于,具体包括以下步骤:步骤1,获取需进行异常检测的图像数据,并对其进行预处理,将预处理后的数据划分训练集及测试集;步骤2,采用训练集对图像异常检测模型进行训练,得到训练好的图像异常检测模型;所述图像异常检测模型包括基于注意力机制的变分自编码器、SE模块和判别器,判别器连接到基于注意力机制的变分自编码器的输出端,基于注意力机制的变分自编码器包括编码器和解码器,SE模块连接在编码器和解码器之间;步骤3,将待检测的图像进行预处理,然后导入步骤2训练好的图像异常检测模型中得到异常分数,作为异常检测结果。2.如权利要求1所述的融合AVAE和SE模块的图像异常检测方法,其特征在于,所述编码器采用多个卷积层和多个自注意机制模块交叉叠加得到。3.如权利要求2所述的融合AVAE和SE模块的图像异常检测方法,其特征在于,所述编码器中包括3个卷积层和3个自注意力机制模块。4.如权利要求1所述的融合AVAE和SE模块的图像异常检测方法,其特征在于,所述SE模块包括依次连接的压缩模块、激励模块和scale操作;所述压缩模...

【专利技术属性】
技术研发人员:侯爱琴汝乐王瑜琨屈新纪陈竹莲
申请(专利权)人:西北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1