【技术实现步骤摘要】
一种基于深度卷积生成对抗网络的图像异常检测方法
[0001]本专利技术涉及图像异常检测的
,尤其是指一种基于深度卷积生成对抗网络的图像异常检测方法。
技术介绍
[0002]图像异常检测是一种检测所给图像中是否存在异常样本以及指出异常样本的位置的技术。异常样本是一种在现实世界中广泛存在的概念,常指不符合人们对正常模式的定义的样本,例如工业产品的瑕疵、疾病检查中的异常症状、安全检查中的违禁品、监控视频中的违规行为等。因此,图像异常检测技术在安全检测、质量检测、医学诊疗、行为预警等方面都有着巨大的应用前景。
[0003]对于异常检测问题来说,一方面,异常在现实中的出现频率是非常低的,而且异常的类型又往往是多种多样的。另一方面,正常的样本数量庞大且容易收集。因此,通常很难收集到足够多的异常样本来代表异常的模式,却很容易收集大量的正常样本来代表正常的模式。对此,在无监督的条件下,利用深度卷积神经网络的自重建类型的方法被广泛地应用于图像异常检测。
[0004]无监督自重建的图像异常检测方法是指在训练时只采用正常样本 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度卷积生成对抗网络的图像异常检测方法,其特征在于,包括以下步骤:1)数据获取:获取公开的异常检测图像数据集,并划分为训练数据集与验证数据集,其中训练数据集用于深度卷积生成对抗网络训练阶段,验证数据集用于深度卷积生成对抗网络验证阶段;生成深度卷积生成对抗网络训练和验证所需的12张条状掩膜;2)数据处理:将异常检测图像数据集的图像和掩膜通过缩放、逐元素相乘和归一化后,转化为训练深度卷积生成对抗网络所需的待重建图像;3)网络构建:根据训练目标以及模型的输入输出形式,构造出一个适用于图像异常检测问题的深度卷积生成对抗网络,不仅能够检测到异常样本以及异常位置,也能够提升正常样本和异常样本的可区分性;该网络由生成器和判别器构成,生成器的输入为待重建图像,输出为重建图像,判别器促进重建图像更接近于原始图像,生成器中使用了空洞卷积残差块实现对上下文语义的学习;4)定义损失函数:根据训练目标以及深度卷积生成对抗网络的架构,定义生成器所需的重建损失函数和判别器所需的对抗学习损失函数,对重建损失函数和对抗学习损失函数通过加权方式组合成总损失函数;5)训练网络:初始化深度卷积生成对抗网络中各个神经网络层的参数,并采用训练数据集进行训练,不断迭代输入训练样本,根据总损失函数计算得到深度卷积生成对抗网络的损失值,再通过反向传播计算出各个神经网络层的参数梯度,通过随机梯度下降法对各个神经网络层的参数进行更新;6)网络验证:使用验证数据集对训练后的深度卷积生成对抗网络进行图像异常检测任务的验证,测试训练好的深度卷积生成对抗网络的图像异常检测能力,后续用训练好的深度卷积生成对抗网络对异常检测图像进行检测,即可得到准确的检测结果。2.根据权利要求1所述的一种基于深度卷积生成对抗网络的图像异常检测方法,其特征在于,在步骤1)中,所述异常检测图像数据集包括三个公开数据集MNIST、CIFAR
‑
10、MVTec AD和一个自行收集整理的数据集LaceAD;其中MNIST和CIFAR是经典的图像分类数据集,通过模拟划分正常与异常类别的方式用于图像异常检测;MVTec AD是首个现实世界异常检测数据集;LaceAD是自行收集整理的蕾丝布匹瑕疵数据集;所述条状掩膜为多尺度的条状掩膜,用于区分哪些区域的内容需要保留、哪些区域的内容需要擦除;在每一张掩膜中,被擦除区域的像素值设置为0,非擦除区域的像素值设置为1,擦除区域与非擦除区域的比例为1:1;通过交换擦除区域和非擦除区域的位置,能够获得一对互补的掩膜,保证异常检测图像数据集中的图像的每个位置被擦除的概率相等;通过改变条形宽度,能够获得不同尺度的掩膜;通过设置水平和垂直两个方向的条纹,能够集合来自不同方向的语义上下文信息。3.根据权利要求1所述的一种基于深度卷积生成对抗网络的图像异常检测方法,其特
征在于,所述步骤2)包括以下步骤:2.1)将异常检测图像数据集中的图像和掩膜缩放到长和宽为512
×
512像素大小;2.2)对缩放后的图像和随机抽选的一种掩膜进行逐元素乘积,得到中间图像;2.3)将中间图像从[0,255]转换到[0,1]的范围内,得到待重建图像。4.根据权利要求1所述的一种基于深度卷积生成对抗网络的图像异常检测方法,其特征在于,所述步骤3)包括:a、构造生成器生成器用于对待重建图像进行图像重建,得到重建图像;生成器的输入为3
×
512
×
512的待重建图像,输出为3
×
512
×
512的重建图像;生成器由编码器、连接编码器和解码器的空洞卷积残差块以及解码器这三部分组成,具体情况如下:a1、构造编码器编码器相当于一个特征提取网络,从输入图像中提取高层语义信息并且保存到一个低维的编码中,编码器的输入为3
×
512
×
512的待重建图像,输出为512
×
64
×
64的编码特征;为实现从输入到输出的转换,编码器包含1个普通卷积块和3个级联的下采样层;普通卷积块由普通卷积层、实例正则化层以及非线性激活函数层组成,其中,普通卷积层设置卷积核大小为7
×
7,卷积步长为1;下采样层由普通卷积层、实例正则化层以及非线性激活函数层串联而成,其中,普通卷积层设置卷积核大小为4
×
4,卷积步长为2;卷积层用于计算特征映射,实例正则化层通过归一化每个输入样本的单个通道的均值和标准差,起到了加速模型收敛和保持每个样本实例之间的独立的作用,非线性激活函数层用于防止模型退化为简单的线性模型,提高模型的描述能力,编码器中的非线性激活函数层使用的都是ReLU非线性激活函数;a2、构造空洞卷积残差块空洞卷积残差块位于编码器与解码器之间,总共有8个空洞卷积残差块,且每个空洞卷积残差块的结构一致,起到学习上下文的语义信息和连通编码器与解码器的作用;每个空洞卷积残差块的输入和输出都是512
×
64
×
64的低维编码特征;为实现从输入到输出的转换,每个空洞卷积残差块由普通卷积层、实例正则化层、非线性激活函数层、空洞卷积层和实例正则化层这5个网络层顺序串联组成,其中,普通卷积层设置卷积核大小为3
×
3,卷积步长为1,将输入特征映射到另一个特征空间,实例正则化层和非线性激活函数层的作用与编码器中相同,非线性激活函数层的激活函数替换为Le...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。