图片生成模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38577999 阅读:32 留言:0更新日期:2023-08-26 23:24
本发明专利技术涉及人工智能技术领域,应用了深度学习技术,可以应用于医疗领域,有利于提高医学图像生成的准确性。涉及一种图片生成模型的训练方法、装置、电子设备及存储介质。该方法包括:获取训练数据;提取训练集和正样本集的图像特征向量;通过扩散加噪模块对提取到的图像特征向量进行t层扩散加噪,并得到每层扩散后的噪声分布值和待定图像特征向量;通过损失函数计算每层扩散的噪声损失值以及对比损失值并求和计算出总损失值;根据总损失值调整图片生成模型的参数,得到训练完成的标准图片生成模型。本发明专利技术在扩散模型基础之上,增加了每一次扩散生成的x进行对比学习,并计算对比损失,有利于模型的收敛以及生成图片的效果。有利于模型的收敛以及生成图片的效果。有利于模型的收敛以及生成图片的效果。

【技术实现步骤摘要】
图片生成模型的训练方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能
,应用了深度学习技术,涉及一种图片生成模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]目前医学领域中实现医学图像图片生成的方法一般使用的对抗神经网络,或者是自变分编码器。其中对抗神经网络是由一个生成器和一个判别器组成,由生成器生成图片,由判别器判别图片是真实图片还是生成的,再将损失梯度去更新生成器的参数,这个网络模型的缺点就是模型难收敛。自变分编码器是一个比较传统的图片生成模型,训练过程是将图片进行编码后再进行解码还原回自身图片,这个过程相对简单,缺点是生成的图片多样性不足。

技术实现思路

[0003]鉴于以上内容,有必要提供一种图片生成模型的训练方法,其主要目的在于提高图片生成质量。
[0004]为实现上述目的,本专利技术提供一种图片生成模型的训练方法,应用于图片生成模型训练装置,所述装置包括预处理模块、图像特征编码模块、扩散加噪模块、噪声损失值模块、对比损失值模块和总损失值模块,其特征在于,所述方法包括:...

【技术保护点】

【技术特征摘要】
1.一种图片生成模型的训练方法,其特征在于,所述方法包括:S1、从数据库中获取训练数据,所述训练数据包括训练集、正样本集以及所述训练集对应的第一真实噪声分布值和所述正样本集对应的第二真实噪声分布值,所述正样本集是对所述训练集进行数据增强后得到;S2、通过图像特征编码模块对所述训练集和所述正样本集进行图像特征提取,得到所述训练集的第一图像特征向量和所述正样本集的第二图像特征向量;S3、通过扩散加噪模块对所述第一图像特征向量进行t层扩散加噪,每层得到第一噪声分布值和第一待定图像特征向量,同理得到所述第二图像特征向量的第二噪声分布值和第二待定图像特征向量;S4、通过预设损失函数对所述第一噪声分布值与所述第一真实噪声分布值进行计算得到第一噪声损失值,同理计算得到所述第二噪声分布值与所述第二真实噪声分布值的第二噪声损失值;S5、通过预设对比损失函数对所述第一待定图像特征向量和所述第二待定图像特征向量进行计算得到对比损失值;S6、将所述噪声损失值和所述对比损失值相加得到总损失值,将所述总损失值与预设阈值进行比较;若所述总损失值大于或等于预设阈值,则更新所述图片生成模型的参数直至所述总损失值小于预设阈值;若所述总损失值小于预设阈值,则输出标准图片生成模型。2.如权利要求1所述的图片生成模型的训练方法,其特征在于,通过扩散加噪模块对所述第一图像特征向量进行t层扩散加噪,每层得到第一噪声分布值和第一待定图像特征向量,同理得到第二图像特征向量的第二噪声分布值和第二待定图像特征向量,包括:使用扩散加噪模块对所述第一图像特征向量进行t层扩散,t为大于1的正整数;在各个扩散层中加入噪声,计算所述第一图像特征向量在各扩散层扩散后的t个第一噪声分布值和t个第一待定图像特征向量;根据所述第一噪声分布值的计算方式计算所述第二图像特征向量在各扩散层扩散后的t个第二噪声分布值和t个第二待定图像特征向量。3.如权利要求2所述的图片生成模型的训练方法,其特征在于,使用扩散加噪模块对所述第一图像特征向量进行t层扩散,t为大于1的正整数;在各个扩散层中加入噪声,计算所述第一图像特征向量在各扩散层扩散后的t个第一噪声分布值和t个第一待定图像特征向量,包括:利用下述公式对所述第一图像特征向量进行t层扩散:其中x为输入的第一待定图像特征向量,t为扩散的层数,β为预先设置的参数,I为加入高斯噪声的方差,q(x
t
|x
t
‑1)为当前图片x的噪声分布,表示分布。4.如权利要求3所述的图片生成模型的训练方法,其特征在于,对所述第一图像特征向量进行t层扩散的公式还可以为:
α
t
=1

βI其中,x0为输入的第一图像特征向量,x
t
为扩散到t层的第一待定图像特征向量,表示分布,β为预先设置的参数,I为加入高斯噪声的方差,α
t
表示第t层的概率分布,表示对α
t
进行求导。5.如权利要求1所述的图片生成模型的训练方法,其特征在于,通过预设损失函数对所述第一噪声分布值与所述第一真实噪声分布值进行计算得到第一噪声损失值、同理计算得到第二噪声分布值与所述第二真实噪声分布值的第二噪声损失值,包...

【专利技术属性】
技术研发人员:舒畅陈又新
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1