一种基于核心记忆库残差的图像异常检测方法技术

技术编号：39501490 阅读：23 留言：0更新日期：2023-11-24 11:32

本发明专利技术公开了一种基于核心记忆库残差神经网络的图像异常检测方法，包括：获取图像数据；通过编码器提取特征，在训练集正样本特征上利用核心集采样策略构建具有代表性的正样本记忆库；训练阶段输入经过异常模拟策略后的图像

全部详细技术资料下载

【技术实现步骤摘要】
一种基于核心记忆库残差的图像异常检测方法

[0001]本专利技术涉及视觉检测

、
图像异常检测
，特别是涉及一种基于核心记忆库残差的图像异常检测方法
。

技术介绍

[0002]近年来，计算机视觉和深度学习等技术得到了迅速发展，基于深度学习的视觉检测已经取得了巨大的成功
。
然而受限于异常样本的数据稀缺问题
、
异常类的未知性问题以及数据标注问题，一般的基于监督学习的视觉缺陷检测方法难以应用
。
为此，目前研究提出了深度图像异常检测任务，旨在开发在训练期间不需要使用大量有标注异常数据的情况下检测异常的算法，在解决视觉检测的上述缺点方面具有巨大潜力
。
[0003]目前深度图像异常检测方法可分为基于图像重构的方法
、
基于表示的方法等
。
基于图像重构的方法多根据重建正常图像后的误差来定位异常
。GANomaly
将
GAN
中对抗训练的思想引入到传统
AE
的训练框架中，同时在生成器后接入了额外的编码器
。Venkataramanan
等人将
VAE、GAN
等手段结合起来，首次将注意力机制引入异常检测领域
。
然而重建模型在推理阶段易受到异常区域的影响，图像中的异常区域也被有效重建，从而使得异常判别无效
。
基于表示的方法通常通过比较高维的待测样本的特征与正常特征来进行异常检...

【技术保护点】

【技术特征摘要】
1.
一种基于核心记忆库残差神经网络的图像异常检测方法，其特征在于，包括：获取图像数据；通过编码器提取图像特征，在训练集正样本特征上利用核心集采样策略构建正样本记忆库；在异常检测模型训练阶段输入经过异常模拟策略后的图像，推断阶段输入待识别图像获取特征，在正样本记忆库中查询与待识别图像获取特征最接近的正样本特征；将编码器前三层输出的特征及其与最接近的正样本特征的残差拼接输入多尺度融合模块，获取增强特征；将增强特征与解码器特征连接，利用干扰挖掘策略，逐步细化分割结果，获取异常识别与定位结果
。2.
根据权利要求1所述的一种基于核心记忆库残差神经网络的图像异常检测方法，其特征在于，图像数据包括获取模拟异常样本图像：选取两个数据集，利用异常模拟策略从两个数据集获取模拟异常样本
。3.
根据权利要求1所述的一种基于核心记忆库残差神经网络的图像异常检测方法，其特征在于，通过编码器提取特征，在训练集正样本特征上利用核心集采样策略构建具有代表性的正样本记忆库，包括：采用在
ImageNet
数据集训练好的模型作为编码器，固定编码器的参数，获取图像特征，作为训练集正样本特征；在训练集正样本特征上利用核心集采样策略构建正样本记忆库
。4.
根据权利要求3所述的一种基于核心记忆库残差神经网络的图像异常检测方法，其特征在于，利用核心集采样策略构建正样本记忆库，包括：对训练集正样本特征进行降维，获取特征集
M
，初始化核心集
M
C
；循环使用极小化极大优化函数选择核心集，经选择的特征加入核心集
M
C
，直至达到设置的核心集大小，具体优化函数如下：其中表示每次选择加入核心集的最优特征，
m
表示从训练集正样本特征中选择的特征，
n
表示从现有核心集中选择的特征
。5.
根据权利要求1所述的一种基于核心记忆库残差神经网络的图像异常检测方法，其特征在于，训练阶段输入经过异常模拟策略后的图像，推断阶段输入待识别图像获取特征，在正样本记忆库中查询与待识别图像获取特征最接近的正样本特征包括：给定处于训练或推理阶段的输入图像；固定编码器的前三层参数，获取输入特征；在记忆库中利用最近邻搜索查询与输入特征最接近的正样本特征获取残差特征
。6.
根据权利要求1所述的一种基于核心记忆库残差神经网络的图像异常检测方法，其特征在于，将待识别图像获取的特征及其与最接近的正样本特征的残差输入多尺度融合模块，获取增强特征，包括：将固定编码器网络的前三层输出的特征与其与最接近正样本的残差拼接获得残差特征
CI
；
将残差特征
CI
通过双向特征金字塔网络实现多尺度信息交互，最终获取不同尺度的增强特征
。7.
根据权利要求6所述的一种基于核心记忆库残差神经网络的图像异常检测方法，其特征在于，双向特征金字塔网利用特征融合模块融合输入特征，包括：将各个特征尺度拼接，将拼接后得到的特征通过通道注意力模块，得到加权结果，通道注意力机制表达为：
M
C
(F)
＝
σ
(MLP(AvgPool(F))+MLP(MaxPool(F)))M
C
(F)
表示通道注意力模块生成的特征图，
F
表示输入的特征，
σ
表示
sigmoid
激活函数，
MLP
表示多层感知器
、AvgPool(F)
表示对特征进行平均池化，
MaxPool(F)
表示对特征进行全局最大池化；将通道注意力模块生成的特征图经过空间注意力模块，最终进行加权获取增强特征，...

【专利技术属性】
技术研发人员：刘艳霞，李宇虹，周月，赖浩宇，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人