一种缺陷样本的生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38476435 阅读:21 留言:0更新日期:2023-08-15 16:56
本申请公开了一种缺陷样本的生成方法、装置、电子设备及存储介质;该方法包括:对标准高斯噪声进行随机采样,将采样得到的噪声的分布作为当前时间步的噪声特征,将该噪声特征和目标缺陷对应的语义标签输入至缺陷生成网络中,预测出上一个时间步的扩散噪声的分布;基于该扰动噪声的分布随机采样得到上一个时间步的扩散噪声;根据该扩散噪声和当前时间步的噪声特征,计算上一个时间步的噪声特征;重复上述操作,直到计算出第0个时间步的噪声特征;基于第0个时间步的噪声特征生成目标缺陷对应的局部缺陷图像;将该图像输入缺陷融合网络中,生成目标缺陷对应的缺陷样本。本申请实施例可以生成高逼真度的局部缺陷,并将其自然地融入到正常样本中。正常样本中。正常样本中。

【技术实现步骤摘要】
一种缺陷样本的生成方法、装置、电子设备及存储介质


[0001]本申请实施例涉及人工智能
,尤其涉及一种缺陷样本的生成方法、装置、电子设备及存储介质。

技术介绍

[0002]近年来,缺陷检测在许多领域都具有重要的意义。在制造业中,缺陷检测可以帮助企业及时发现生产线上的缺陷,防止缺陷产品流入市场。这不仅可以保证产品质量,提高用户满意度,同时也可以降低企业的成本和损失。或在医疗领域,缺陷检测可以帮助医生及时发现疾病的病灶和异常,从而提高诊断准确率和治疗效果。例如,在医学影像领域,缺陷检测可以帮助医生发现肿瘤、血管病变等病灶,从而辅助诊断和治疗。
[0003]目前,利用深度学习技术进行缺陷检测是主流的技术手段。然而,基于深度学习的监督方法需要大量的标记数据来训练模型,但实际上,标注数据往往是稀缺的,特别是对于缺陷数据的情况下。首先,由于真实的缺陷样本往往比正常样本难以获得,缺陷检测的样本数量往往有限,这会限制缺陷检测系统的性能。通过缺陷样本生成技术,可以合成大量的缺陷样本,从而使得缺陷检测系统可以更全面地学习缺陷的特征和模式,从而提高检测性能。
[0004]当前,已经有一些基于非监督学习的缺陷样本生成方法,例如,基于生成对抗网络(GAN)的方法,变分自编码器(VAE)等方法。这些方法可以通过随机生成数据来增加缺陷样本数量,但由于数据生成的不确定性,生成的缺陷样本可能不够准确和可靠,也存在着一定的缺陷偏差。为此,研究人员提出了扩散模型(Diffusion Model)缓解上述生成式模型的问题。扩散模型是一种基于概率的生成模型,用于生成具有高度逼真性质的样本。扩散模型的基本思想是将样本视为一个初始状态,并通过一系列随机的、逆向的扩散过程,逐步将样本从一个随机状态扩散到一个真实的样本空间。扩散模型相较于传统的生成模型,具有以下优点:扩散操作是可逆的,可以精确控制样本的生成过程,从而生成高质量的样本;扩散过程中的漫步随机性使得模型对不同数据具有一定的适应性。
[0005]然而,基于上述的生成模型直接生成缺陷样本的难度较大,主要是缺陷部位占样本面积较小,模型难以专注缺陷的生成,网络可能更加关注样本背景的生成。因此,上述单独的生成模型都难以直接生成高度逼真的缺陷样本。

技术实现思路

[0006]本申请提供一种缺陷样本的生成方法、装置、电子设备及存储介质,可以生成高逼真度的局部缺陷,并将其自然地融入到正常样本中。
[0007]第一方面,本申请实施例提供了一种缺陷样本的生成方法,所述方法包括:
[0008]对标准高斯噪声进行随机采样,将随机采样得到的噪声的分布作为当前时间步的噪声特征f
T
,并将所述当前时间步的噪声特征f
T
和预先获取的目标缺陷对应的语义标签y输入至预先训练好的缺陷生成网络CUNet中,通过所述预先训练好的缺陷生成网络CUNet预测出所述当前时间步的上一个时间步的扩散噪声的分布ε
θ
(f
T
,T,y);
[0009]基于所述上一个时间步的扰动噪声的分布ε
θ
(f
T
,T,y)随机采样得到所述上一个时间步的扩散噪声;并根据所述上一个时间步的扩散噪声和所述当前时间步的噪声特征f
T
,计算所述上一个时间步的噪声特征f
T
‑1;将所述上一个时间步作为所述当前时间步,重复执行上述操作,直到计算出第0个时间步的噪声特征f0;
[0010]基于第0个时间步的噪声特征f0生成所述目标缺陷对应的局部缺陷图像;
[0011]将所述局部缺陷图像输入预先训练好的缺陷融合网络中,通过所述缺陷融合网络生成所述目标缺陷对应的缺陷样本。
[0012]第二方面,本申请实施例还提供了一种缺陷样本的生成装置,所述装置包括:预测模块、计算模块、生成模块和融合模块;其中,
[0013]所述预测模块,用于对标准高斯噪声进行随机采样,将随机采样得到的噪声的分布作为当前时间步的噪声特征f
T
,并将所述当前时间步的噪声特征f
T
和预先获取的目标缺陷对应的语义标签y输入至预先训练好的缺陷生成网络CUNet中,通过所述预先训练好的缺陷生成网络CUNet预测出所述当前时间步的上一个时间步的扩散噪声的分布ε
θ
(f
T
,T,f);
[0014]所述计算模块,用于基于所述上一个时间步的扰动噪声的分布ε
θ
(f
T
,T,y)随机采样得到所述上一个时间步的扩散噪声;并根据所述上一个时间步的扩散噪声和所述当前时间步的噪声特征f
T
,计算所述上一个时间步的噪声特征f
T
‑1;将所述上一个时间步作为所述当前时间步,重复执行上述操作,直到计算出第0个时间步的噪声特征f0;
[0015]所述生成模块,用于基于第0个时间步的噪声特征f0生成所述目标缺陷对应的局部缺陷图像;
[0016]所述融合模块,用于将所述局部缺陷图像输入预先训练好的缺陷融合网络中,通过所述缺陷融合网络生成所述目标缺陷对应的缺陷样本。
[0017]第三方面,本申请实施例提供了一种电子设备,包括:
[0018]一个或多个处理器;
[0019]存储器,用于存储一个或多个程序,
[0020]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本申请任意实施例所述的缺陷样本的生成方法。
[0021]第四方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请任意实施例所述的缺陷样本的生成方法。
[0022]本申请实施例提出了一种缺陷样本的生成方法、装置、电子设备及存储介质,先对标准高斯噪声进行随机采样,将随机采样得到的噪声的分布作为当前时间步的噪声特征,并将当前时间步的噪声特征和预先获取的目标缺陷对应的语义标签输入至预先训练好的缺陷生成网络中,通过预先训练好的缺陷生成网络预测出当前时间步的上一个时间步的扩散噪声的分布;然后基于上一个时间步的扰动噪声的分布随机采样得到上一个时间步的扩散噪声;并根据上一个时间步的扩散噪声和当前时间步的噪声特征,计算当前时间步的上一个时间步的噪声特征;将上一个时间步作为当前时间步,重复执行上述操作,直到计算出第0个时间步的噪声特征;再基于第0个时间步的噪声特征生成目标缺陷对应的局部缺陷图像;最后将局部缺陷图像输入预先训练好的缺陷融合网络中,通过缺陷融合网络生成目标缺陷对应的缺陷样本。也就是说,在本申请的技术方案中,缺陷样本的生成方法是基于多阶段的,在第一阶段,通过缺陷生成网络生成局部缺陷图像;在第二阶段,通过缺陷融合网络
生成高度真实的缺陷样本。并且本申请通过逆向扩散过程,逐步将样本从一个随机状态扩散到一个真实的样本空间。本申请相较于传统的生成模型具有以下优点:扩散操作是可逆的,可以精确控制样本的生成过程,从而生成高质量的样本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种缺陷样本的生成方法,其特征在于,所述方法包括:对标准高斯噪声进行随机采样,将随机采样得到的噪声的分布作为当前时间步的噪声特征f
T
,并将所述当前时间步的噪声特征f
T
和预先获取的目标缺陷对应的语义标签y输入至预先训练好的缺陷生成网络CUNet中,通过所述预先训练好的缺陷生成网络CUNet预测出所述当前时间步的上一个时间步的扩散噪声的分布ε
θ
(f
T
,T,y);基于所述上一个时间步的扰动噪声的分布ε
θ
(f
T
,T,y)随机采样得到所述上一个时间步的扩散噪声;并根据所述上一个时间步的扩散噪声和所述当前时间步的噪声特征f
T
,计算所述上一个时间步的噪声特征f
T
‑1;将所述上一个时间步作为所述当前时间步,重复执行上述操作,直到计算出第0个时间步的噪声特征f0;基于第0个时间步的噪声特征f0生成所述目标缺陷对应的局部缺陷图像;将所述局部缺陷图像输入预先训练好的缺陷融合网络中,通过所述缺陷融合网络生成所述目标缺陷对应的缺陷样本。2.根据权利要求1所述的方法,其特征在于,在对标准高斯噪声进行随机采样之前,所述方法还包括:若所述缺陷生成网络CUNet不满足预先设置的第一收敛条件,则在预先构建的局部缺陷集I
defect
中提取出预定数量的缺陷样本作为当前批次的训练样本;针对所述当前批次的训练样本中的每一个训练样本,在预先构建的扩散步长集合中随机选择一个步长作为该训练样本对应的步长;使用所述当前批次的训练样本以及各个训练样本对应的步长对所述缺陷生成网络CUNet进行训练,重复执行上述操作,直到所述缺陷生成网络满足所述第一收敛条件。3.根据权利要求2所述的方法,其特征在于,在预先构建的局部缺陷集I
defect
中提取出预定数量的缺陷样本作为当前批次的训练样本之前,所述方法还包括:对预先构建的真实的缺陷样本集中的每一个缺陷样本进行标注,并将缺陷样本集中的真实的缺陷剪切下来形成原始的局部缺陷集将所述原始的局部缺陷集中的每一个缺陷样本分别作为第一缺陷样本,在所述原始的缺陷样本集中随机选择的一个缺陷样本作为各个第一缺陷样本对应的第二缺陷样本,并将各个第一缺陷样本与其对应的第二缺陷样本进行混合,得到各个新的虚拟样本和各个新的虚拟样本对应的标签;基于各个新的虚拟样本、各个新的虚拟样本对应的标签以及所述原始的局部缺陷集构建所述局部缺陷集I
defect
。4.根据权利要求1所述的方法,其特征在于,在将所述局部缺陷图像输入预先训练好的缺陷融合网络中之前,所述方法还包括:若所述缺陷融合网络不满足预先设置的第二收敛条件,则将所述局部缺陷图像添加至预先构建的正常样本中,得到不完美的缺陷样本集在所述不完美的缺陷样本集中随机选择一个不完美的缺陷样本作为当前训练样本;
使用所述当前训练样本对所述缺陷融合网络进行训练,重复执行上述操作,直到所述缺陷融合网络满足所述第二收敛条件。5.根据权利要4所述的方法,其特征在于,使用所述当前训练样本对所述缺陷融合网络进行训练,包括:若判别器不满足预先设置的第三收敛条件,则将所述当前训练样本输入至所述缺陷融合网络中,通过所述缺陷融合网络输出生成的缺陷样本x
fake
;使用所述生成的缺陷样本x
fake
对判别器进行训练,直到所述判别器满足所述第三收敛条件;基于所述生成的缺陷样本x
fake
和训练好的判别器对所述缺陷融合网络进行训练。6.根据权利要求5所述的方法,其特征在于,使用所述生成的缺陷样本x
fake
对判别器进行训练,包括:将所述生...

【专利技术属性】
技术研发人员:黄开竹杨超龙杨关禹赵伟光
申请(专利权)人:昆山杜克大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1