图像生成模型训练方法、图像生成方法及相关装置制造方法及图纸

技术编号:34850097 阅读:19 留言:0更新日期:2022-09-08 07:49
本发明专利技术的提供图像生成模型训练方法、图像生成方法及相关装置,方法包括:获取随机噪声样本和图像样本;根据随机噪声样本和图像样本,对初始的生成对抗网络进行迭代训练,直到预构建的损失函数达到设定条件,将训练后的生成对抗网络作为图像生成模型;其中,损失函数是基于随机噪声样本得到的生成图像之间的距离信息、生成图像和图像样本的判别信息以及预设参数信息构建的;迭代训练用于降低生成图像之间的相似度。针对相似度很高的噪声,本发明专利技术可以得到不同的生成图像,拉大生成图像对应的分布模式之间的距离,从而可以解决模式崩溃问题。题。题。

【技术实现步骤摘要】
图像生成模型训练方法、图像生成方法及相关装置


[0001]本专利技术涉及深度学习
,具体而言,涉及一种图像生成模型训练方法、图像生成方法及相关装置。

技术介绍

[0002]生成对抗网络(GAN,Generative Adversarial Networks)是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一,在图像生成、图像修复、图像转换等领域得到了广泛关注。
[0003]生成对抗网络由生成器和判别器组成,二者是对抗的关系。判别器学习分辨真实样本与生成器生成的假样本,而生成器则使判别器认为自己生成的样本是真实样本。随着训练的进行,判别器的分辨能力越来越强,生成器生成的样本也越来越接近真实样本。但是生成对抗网络的训练自由度太大,生成器和判别器很容易陷入不正常的对抗状态,发生模式崩溃,导致生成图像多样性不足,严重模式崩溃时生成的所有图片都一样。
[0004]目前,解决模式崩溃问题的方法大多都是从模型结构入手,但是这种解决方式因模型的改动会增加计算资源消耗,增加了模型训练的复杂度,因此,如何提供一种精简有效的训练方法,是需要解决的技术问题。

技术实现思路

[0005]本专利技术目的之一在于提供一种图像生成模型训练方法、图像生成方法及相关装置,用以解决模式崩溃问题,提高图像生成质量。
[0006]第一方面,本专利技术提供一种图像生成模型训练方法,所述方法包括:获取随机噪声样本和图像样本;根据所述随机噪声样本和所述图像样本,对初始的生成对抗网络进行迭代训练,直到预构建的损失函数达到设定条件,将训练后的生成对抗网络作为图像生成模型;其中,所述损失函数是基于所述随机噪声样本得到的生成图像之间的距离信息、所述生成图像和所述图像样本的判别信息以及预设参数信息构建的;所述迭代训练用于降低所述生成图像之间的相似度。
[0007]第二方面,本专利技术提供一种图像生成方法,所述方法包括:获取随机噪声样本;将所述随机噪声样本输入图像生成模型中,生成第一图像和第二图像,所述第一图像和所述第二图像不同;所述图像生成模型是通过如第一方面提供的图像生成模型训练方法得到的。
[0008]第三方面,本专利技术提供一种图像生成模型训练装置,包括:获取模块,用于获取随机噪声样本和图像样本;训练模块,用于根据所述随机噪声样本和所述图像样本,对初始的生成对抗网络进行迭代训练,直到预构建的损失函数达到设定条件,将训练后的生成对抗网络作为图像生成模型;其中,在每次迭代训练中,所述损失函数是基于所述随机噪声样本得到的生成图像之间的距离信息、所述生成图像和所述图像样本的判别信息以及预设参数信息构建的;所述迭代训练用于降低所述生成图像之间的相似度。
[0009]第四方面,本专利技术提供一种图像生成装置,包括:获得模块,用于获取随机噪声样本;生成模块,用于将所述随机噪声样本输入图像生成模型中,生成第一图像和第二图像;所述第一图像和所述第二图像不同;所述图像生成模型是通过如第一方面所述的图像生成模型训练方法得到的。
[0010]第五方面,本专利技术提供一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序以实现如第一方面所述的方法或者如第二方面所述的方法。
[0011]第六方面,本专利技术提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法或者如第二方面所述的方法。
[0012]本专利技术的提供图像生成模型训练方法、图像生成方法及相关装置,方法包括:获取随机噪声样本和图像样本;根据所述随机噪声样本和所述图像样本,对初始的生成对抗网络进行迭代训练,直到预构建的损失函数达到设定条件,将训练后的生成对抗网络作为图像生成模型;其中,所述损失函数是基于所述随机噪声样本得到的生成图像之间的距离信息、所述生成图像和所述图像样本的判别信息以及预设参数信息构建的;所述迭代训练用于降低所述生成图像之间的相似度。与现有技术从模型结构的角度解决模式崩溃的方式不同,本专利技术从损失函数的角度进行优化,基于所述随机噪声样本得到的生成图像之间的距离信息、所述生成图像和所述图像样本的判别信息以及预设参数信息构建的,并基于该损失函数进行模型训练,得到的模型针对相似度很高的噪声,可以得到不同的生成图像,拉大生成图像对应的分布模式之间的距离,从而可以解决模式崩溃问题。
附图说明
[0013]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0014]图1为GAN出现的模式崩溃的示意图;
[0015]图2为本专利技术实施例提供的电子设备的结构框图;
[0016]图3为本专利技术实施例提供的构建损失函数的示意性流程图;
[0017]图4为本专利技术实施例提供的损失函数的效果示意图;
[0018]图5为本专利技术实施例提供的迭代次数与平衡因子之间的概率曲线信息图;
[0019]图6为本专利技术实施例提供的图像生成模型训练方法的示意性流程图;
[0020]图7为本专利技术实施例提供的训练方法的示例图;
[0021]图8为本专利技术实施例提供的训练方法的效果示意图;
[0022]图9为本专利技术实施例提供的图像生成模型的测试效果图;
[0023]图10为本专利技术实施例提供的图像生成方法的示意性流程图;
[0024]图11为本专利技术实施例提供的图像生成模型训练装置的功能模块;
[0025]图12为本专利技术实施例提供的图像生成装置的功能模块图。
具体实施方式
[0026]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。
[0027]因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0028]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0029]在本专利技术的描述中,需要说明的是,若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该专利技术产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。
[0030]此外,若本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像生成模型训练方法,其特征在于,所述方法包括:获取随机噪声样本和图像样本;根据所述随机噪声样本和所述图像样本,对初始的生成对抗网络进行迭代训练,直到预构建的损失函数达到设定条件,将训练后的生成对抗网络作为图像生成模型;其中,所述损失函数是基于所述随机噪声样本得到的生成图像之间的距离信息、所述生成图像和所述图像样本的判别信息以及预设参数信息构建的;所述迭代训练用于降低所述生成图像之间的相似度。2.根据权利要求1所述的图像生成模型训练方法,其特征在于,所述损失函数是通过如下方式构建的:根据所述随机噪声样本得到的第一生成图像和第二生成图像,构建距离信息损失模型;其中,所述第一生成图像是基于所述随机噪声样本生成的;所述第二生成图像是基于所述噪声样本的随机扰动样本生成的;根据所述第一生成图像和所述图像样本的判别信息、以及第一权重信息、构建判别信息损失模型;基于根据所述距离信息损失模型、所述距离信息损失模型对应的第二权重信息以及所述判别信息损失模型,构建所述损失函数;或者,基于根据所述距离信息损失模型、所述距离信息损失模型对应的第二权重信息、所述判别信息损失模型、以及平衡因子、随机系数,构建所述损失函数,构建所述损失函数。3.根据权利要求2所述的图像生成模型训练方法,其特征在于,所述方法还包括:在每次迭代训练中,根据预设的迭代次数与平衡因子之间的概率曲线信息,确定所述每次迭代训练对应的平衡因子的数值,并从预设分布模型中随机采样,得到所述随机系数。4.根据权利要求2所述的图像生成模型训练方法,其特征在于,所述生成对抗网络包含生成器和判别器;根据所述随机噪声样本和所述图像样本,对初始的生成对抗网络进行迭代训练,直到预构建的损失函数达到设定条件,将训练后的生成对抗网络作为图像生成模型,包括:将所述随机噪声样本输入到所述生成器,得到所述第一生成图像和所述第二生成图像;将所述第一生成图像和所述图像样本输入到所述判别器,得到所述判别信息;将所述第一生成图像和所述第二生成图像的距离信息输入到所述距离信息损失模型、以及将所述判别信息输入到所述判别信息损失模型中,得到所述损失函数的损失值;保持所述判别器的网络参数固定,并基于所述损失值,更新所述生成器的网络参数;当未达到所述设定条件,返回执行所述将所述随机噪声样本输入到所述生成器,得到所述第一生成图像和所述第二生成图像的步骤,直到所述损失函数达到设定条件,将训练后的生成对抗网络作为图像生成模型。5.根据权利要求4所述的图像生成模型训练方法,其特征在于,...

【专利技术属性】
技术研发人员:杜鸿飞邓攀刘明王晓敏龚海刚刘明辉程旋邓佳丽解天舒
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1