一种基于快速傅里叶卷积的工业图像异常检测方法技术

技术编号:34457930 阅读:48 留言:0更新日期:2022-08-06 17:08
本发明专利技术公开了一种基于快速傅里叶卷积(FFC)的工业图像异常检测方法,所述方法包括获取异常图片;将所述异常图片输入预先训练过的基于快速傅里叶卷积搭建的图像异常检测模型中,获取重建图片;使用L2函数计算所述异常图片与重建图片的差值;将所述差值与预先设置的阈值进行比较,获取最终检测结果。所述图像异常检测模型的训练方法,包括:获取正常样本图片,将正常样本图片经过随机掩码变成异常图片;将异常图片输入预先构建的图像异常检测模型中进行训练,其中,图像异常检测模型包括高频注意力模块和编码器

【技术实现步骤摘要】
一种基于快速傅里叶卷积的工业图像异常检测方法


[0001]本专利技术涉及一种基于快速傅里叶卷积的工业图像异常检测方法,属于计算机视觉


技术介绍

[0002]计算机视觉领域中异常检测和定位的目的是识别异常图像并定位异常区域,广泛应用于工业缺陷检测、医学图像检测和安全检查等领域。然而,由于异常的概率密度较低,正常和异常数据通常表现出严重的长尾分布,甚至在某些情况下,没有异常样本可用。因此,在实践中很难收集和注释大量异常数据用于监督学习。为了解决这一问题,人们提出了无监督异常检测,它也被称为一分类检测或分布外检测。具体来说就是在训练过程中只使用含有正常样本的数据集进行网络训练,在测试过程中检测出与正常样本差别较大的样本,即为异常样本。
[0003]深度学习中尤其是卷积神经网络(CNN)和残差网络(Resnet),为在多个层次上自动构建综合表示提供了一个强大的替代方案,它们通过搜索特征空间来逼近二元分类问题的决策边界,在特征空间中正态数据的分布被精确建模。事实证明,这种深层特征在捕捉正常数据流形的内在特征方面非常有效。尽管这些方法在各自领域都取得了很好的结果,但它们都只是在图像水平上预测异常,而无需进行空间定位。而在空间定位方面,即像素级异常检测主要通过对图像块及其重建进行像素级比较或对整个图像的概率密度进行逐像素估计来推进异常检测,其中自动编码器、生成性对抗网络(GAN)及其变体是主要模型。然而在以CNN卷积网络为主的异常检测模型中,感受野对于异常图像检测的效果影响极大。感受野指的是一个过滤器可以访问的图像部分。大多数CNN都采用了深度叠加许多具有小感受野的卷积的架构来确保所有图像对网络深层保持可见。然而这种通过多层网络叠加深度来实现网络模型对图像的全局与局部信息的把握理解,一方面增加了模型的复杂度与参数量,另一方面针对工业产品图像异常检测这种小感受野不利于模型理解图像的高级语义信息。

技术实现思路

[0004]本专利技术的目的在于克服现有技术中的检测精度不足问题,提供一种基于快速傅里叶卷积的工业图像异常检测方法,在大多数类别异常检测中均具有优异的检测效果。
[0005]为达到上述目的,本专利技术是采用下述技术方案实现的:
[0006]第一方面,本专利技术提供了一种基于快速傅里叶卷积的工业图像异常检测方法,包括:
[0007]获取异常图片;
[0008]将所述异常图片输入预先训练过的基于快速傅里叶卷积搭建的图像异常检测模型中,获取重建图片;
[0009]使用L2函数计算所述异常图片与重建图片的差值;
[0010]将所述差值与预先设置的阈值进行比较,获取最终检测结果。
[0011]进一步的,所述图像异常检测模型的训练方法,包括:
[0012]获取正常样本图片,将正常样本图片经过随机掩码变成异常图片;
[0013]将异常图片输入预先构建的图像异常检测模型中进行训练,其中,高频注意力模块和编码器

解码器模块。
[0014]进一步的,所述将异常图片输入预先构建的图像异常检测模型中进行训练,包括:
[0015]将异常图片送入高频注意力模块提取正常样本出现次数较高的图像细节信息,得到包含高频注意力的特征图;
[0016]将所述包含高频注意力的特征图送入类U型结构的编码器

解码器中,获取复原重建的无异常图片;
[0017]计算所述正常样本图片和所述复原重建的无异常图片之间的L2差值损失,通过随机梯度下降方法优化L2差值损失,获取最优的图像异常检测模型。
[0018]进一步的,所述将所述包含高频注意力的特征图送入类U型结构的编码器

解码器中,获取复原重建的无异常图片,包括:
[0019]通过编码器对输入的特征图执行编码操作,提取特征图的深层语义信息;
[0020]通过解码器操作,对提取到的深层语义信息进行特征重建,使得特征图重塑为和输入特征图尺寸相同,且将异常区域的信息重塑为正常信息,获取复原重建的无异常图片。
[0021]进一步的,所述计算所述正常样本图片和所述复原重建的无异常图片之间的L2差值损失,公式如下:
[0022][0023]其中,N表示当前卷积层输出的神经元个数对应输出图像的每个像素点,F
oi
表示输出图像在位置i的像素值,F
ii
表示输入图像在位置i的像素值。
[0024]进一步的,所述将所述差值与预先设置的阈值进行比较,获取最终检测结果,包括:
[0025]对计算得到的差值特征图设置阈值,当差值大于阈值时,认定为异常值,当差值小于阈值时,认定为正常值,最终得到异常检测效果图。
[0026]进一步的,所述高频注意力模块包括用于降低信道维数的3
×
3卷积层、用于捕捉全局与局部的交互的FFC层、将值将值限制在0到1之间的sigmoid层。
[0027]进一步的,所述编码器由经典ResNet50结构组成,其中,将ResNet中的3
×
3卷积核替换成快速傅里叶卷积算子组成新的残差块连接;所述解码器包括4个反卷积层和1个上采样层。
[0028]第二方面,本专利技术提供一种工业产品图像异常检测装置,包括:
[0029]异常图片获取单元,用于获取异常图片;
[0030]重建图片获取单元,用于将所述异常图片输入预先训练过的图像异常检测模型中,获取重建图片;
[0031]差值计算单元,用于使用L2函数计算所述异常图片与重建图片的差值;
[0032]检测结果获取单元,用于将所述差值与预先设置的阈值进行比较,获取最终检测结果。
[0033]第三方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任一项所述方法的步骤。
[0034]与现有技术相比,本专利技术所达到的有益效果:
[0035]本专利技术提供一种基于快速傅里叶卷积的工业图像异常检测方法,主要利用快速傅里叶卷积来更好的提取全局与局部之间的关系,使得模型可以高质量修复异常区域的信息,生成一张高质量的无异常图片,进而可以加大输入的原始异常图片与重建图片之间的差值,起到提高异常检测精度的效果,同时也能提高异常的定位精度。
附图说明
[0036]图1是本专利技术实施例提供的一种基于快速傅里叶卷积的工业图像异常检测方法的模型示意图;
[0037]图2是本专利技术实施例提供的高频注意力模块的示意图;
[0038]图3是本专利技术实施例提供的快速傅里叶卷积示意图。
具体实施方式
[0039]下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。
[0040]实施例1
[0041]本实施例介绍一种基于快速傅里叶卷积的工业图像异常检测方法,包括:
[0042]获取异常图片;
[0043]将所述异常图片本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于快速傅里叶卷积的工业图像异常检测方法,其特征在于,包括:获取异常图片;将所述异常图片输入预先训练过的基于快速傅里叶卷积搭建的图像异常检测模型中,获取重建图片;使用L2函数计算所述异常图片与重建图片的差值;将所述差值与预先设置的阈值进行比较,获取最终检测结果。2.根据权利要求1所述的基于快速傅里叶卷积的工业图像异常检测方法,其特征在于:所述图像异常检测模型的训练方法,包括:获取正常样本图片,将正常样本图片经过随机掩码变成异常图片;将异常图片输入预先构建的图像异常检测模型中进行训练,其中,高频注意力模块和编码器

解码器模块。3.根据权利要求2所述的基于快速傅里叶卷积的工业图像异常检测方法,其特征在于:所述将异常图片输入预先构建的图像异常检测模型中进行训练,包括:将异常图片送入高频注意力模块提取正常样本出现次数较高的图像细节信息,得到包含高频注意力的特征图;将所述包含高频注意力的特征图送入类U型结构的编码器

解码器中,获取复原重建的无异常图片;计算所述正常样本图片和所述复原重建的无异常图片之间的L2差值损失,通过随机梯度下降方法优化L2差值损失,获取最优的图像异常检测模型。4.根据权利要求3所述的基于快速傅里叶卷积的工业图像异常检测方法,其特征在于:所述将所述包含高频注意力的特征图送入类U型结构的编码器

解码器中,获取复原重建的无异常图片,包括:通过编码器对输入的特征图执行编码操作,提取特征图的深层语义信息;通过解码器操作,对提取到的深层语义信息进行特征重建,使得特征图重塑为和输入特征图尺寸相同,且将异常区域的信息重塑为正常信息,获取复原重建的无异常图片。5.根据权利要求3所述的基于快速傅里叶卷积的工业图像异常检...

【专利技术属性】
技术研发人员:朱加乐郭浩然江结林
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1