当前位置: 首页 > 专利查询>清华大学专利>正文

图像生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38198084 阅读:14 留言:0更新日期:2023-07-21 16:36
本发明专利技术提供一种图像生成方法、装置、电子设备及存储介质,通过获取训练样本图像;将训练样本图像输入对抗式网络模型以生成近似图像,其中所述对抗式网络模型基于布朗运动控制的损失函数进行训练得到,由于布朗运动控制系统具有稳定性,而对抗式网络模型基于布朗运动控制的损失函数进行训练得到,因此,可以提高模型的训练收敛速度,并且提升模型输入结果的稳定性,从而保证生成近似图像的质量。从而保证生成近似图像的质量。从而保证生成近似图像的质量。

【技术实现步骤摘要】
图像生成方法、装置、电子设备及存储介质


[0001]本专利技术涉及图像生成
,尤其涉及一种图像生成方法、装置、电子设备及存储介质。

技术介绍

[0002]随着人工智能迅速发展,深度学习性能成为人们改进的主要方向。高质量、强标注、大规模、多样本的数据集是深度学习性能优良的关键。由于我们无法得知所有真实环境数据中图像的分布,因此,需要生成近似图像填充数据集。生成对抗网络(Generative AdversarialNetwork,GAN)可以生成近似于真实图像的近似图像,在图像生成、表征学习以及图像到图像的迁移都得到了广泛的应用。GAN采用博弈论方法不断逼近生成的图像与真实图像之间的数据分布,然而,GAN训练的过程经常出现训练速度慢,生成图像质量忽高忽低,稳定性差的情况。相关技术中,通过常微分方程组(Ordinary Dfferential Equation,ODE)在连续时间内进行训练,以生成较为稳定的对抗式网络模型,虽然这种训练轨迹最终收敛,但这样生成的对抗式网络模型的稳定性受训练样本影响较大,即在训练样本很接近平衡点时会很快完成训练,但这样训练出的模型在实际使用场景中应用无法得到保证。此外,这种训练方法也仅仅是获得渐近稳定性,并不保证收敛速度。

技术实现思路

[0003]本专利技术提供一种图像生成方法、装置、电子设备及存储介质,用以解决传统通过对抗式网络模型生成图像时,训练收敛速度慢,训练后输出模型稳定性在实践应用中生成图像质量无法得到保证的缺陷。
[0004]本专利技术提供一种图像生成方法,包括:
[0005]获取训练样本图像;
[0006]将所述训练样本图像输入对抗式网络模型以生成近似图像,其中所述对抗式网络模型基于布朗运动控制的损失函数进行训练得到。
[0007]根据本专利技术提供的一种图像生成方法,所述对抗式网络模型包括生成器和判别器,相应的,所述布朗运动控制函数分别与所述生成器的损失函数和所述判别器的损失函数相结合以控制所述生成器和所述判别器的训练过程。
[0008]根据本专利技术提供的一种图像生成方法,所述生成器的损失函数用于不断优化所述生成器的参数以使其生成的图像趋近真实图像的分布;
[0009]所述判别器的损失函数用于不断优化所述判别器的参数以使其判别出输入图像来自于真实图像分布还是近似图像分布。
[0010]根据本专利技术提供的一种图像生成方法,所述基于布朗运动控制的损失函数为随机微分方程,所述随机微分方程表达式为:
[0011]dX(t)=f(X(t))+u(t);
[0012]其中,dX(t)为基于布朗运动控制的损失函数,X(t)是常微分方程的轨迹即由辨别
器和生成器组成的关于时间的函数向量,f(X(t))为所述生成器和所述判别器原有损失函数对应的微分方程,u(t)为布朗运动控制函数,其中,ρ1、ρ2为非负常数,B1(t)、B2(t)为独立分布的一维布朗运动噪音,β为正整数。
[0013]根据本专利技术提供的一种图像生成方法,所述基于布朗运动控制的损失函数为:
[0014][0015]其中,max
D
L
D

(D;G)为最大化的判别器损失函数,L
D
(D;G)为判别器损失函数,B1(t)、B2(t)为独立分布的一维布朗运动噪音;
[0016]max
G
L
G
G(G;D)为最大化的生成器损失函数,L
G
(G;D)为生成器损失函数,ρ1、ρ2为非负常数。
[0017]根据本专利技术提供的一种图像生成方法,所述生成器和所述判别器原有损失函数对应的微分方程f(X(t))为:
[0018][0019]其中,D(x,t)为判别器函数,p(x)为真实图像数据分布,h1、h3为任意递增函数,h2为任意递减函数,p
G
(x)为生成器分布;
[0020]G(z,t)为生成器函数,p
z
(z)为高斯噪音。
[0021]根据本专利技术提供的一种图像生成方法,所述对抗式网络模型训练结束条件包括:
[0022]训练迭代次数超过预设训练次数阈值;
[0023]或,
[0024]输入图像为近似图像,而判别器无法区分输入图像为真实图像还是近似图像。
[0025]本专利技术还提供一种图像生成装置,包括:
[0026]获取模块,用于获取训练样本图像;
[0027]生成模块,用于将所述训练样本图像输入对抗式网络模型以生成近似图像,其中所述对抗式网络模型基于布朗运动控制的损失函数进行训练得到。
[0028]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的图像生成方法。
[0029]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的图像生成方法。
[0030]本专利技术提供的图像生成方法、装置、电子设备及存储介质,通过获取训练样本图像;将训练样本图像输入对抗式网络模型以生成近似图像,其中对抗式网络模型基于布朗运动控制的损失函数进行训练得到,由于布朗运动控制系统具有稳定性,而对抗式网络模型基于布朗运动控制的损失函数进行训练得到,因此,可以提高模型的训练收敛速度,并且提升模型输入结果的稳定性,从而保证生成近似图像的质量。
附图说明
[0031]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]图1是本专利技术提供的图像生成方法的流程示意图之一;
[0033]图2是本专利技术提供的图像生成装置的结构示意图;
[0034]图3是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0035]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0036]图1为本专利技术实施例提供的图像生成方法的流程图,如图1所示,本专利技术实施例提供的图像生成方法包括:
[0037]步骤101、获取训练样本图像;
[0038]在本专利技术实施例中,训练样本图像可以从CIFAR

10、LSUN

Bedroom 256x256和FFHQ1024x1024等数据集中获取,CIFAR

10数据集是8000万微小图片的标签子集;LSUN是一个比较有特色的大规模数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像生成方法,其特征在于,包括:获取训练样本图像;将所述训练样本图像输入对抗式网络模型以生成近似图像,其中所述对抗式网络模型基于布朗运动控制的损失函数进行训练得到。2.根据权利要求1所述的图像生成方法,其特征在于,所述对抗式网络模型包括生成器和判别器,相应的,所述布朗运动控制函数分别与所述生成器的损失函数和所述判别器的损失函数相结合以控制所述生成器和所述判别器的训练过程。3.根据权利要求2所述的图像生成方法,其特征在于,所述生成器的损失函数用于不断优化所述生成器的参数以使其生成的图像趋近真实图像的分布;所述判别器的损失函数用于不断优化所述判别器的参数以使其判别出输入图像来自于真实图像分布还是近似图像分布。4.根据权利要求3所述的图像生成方法,其特征在于,所述基于布朗运动控制的损失函数为随机微分方程,所述随机微分方程表达式为:dX(t)=f(X(t))+u(t);其中,dX(t)为基于布朗运动控制的损失函数,X(t)是常微分方程的轨迹,即由辨别器和生成器组成的关于时间的函数向量,f(X(t))为所述生成器和所述判别器原有损失函数对应的微分方程,u(t)为布朗运动控制函数,其中,ρ1、ρ2为非负常数,B1(t)、B2(t)为独立分布的一维布朗运动噪音,β为正整数。5.根据权利要求4所述的图像生成方法,其特征在于,所述基于布朗运动控制的损失函数为:其中,max
D
L
D

(D;G)为最大化的判别器损失函数,L
D
(D;G)为判...

【专利技术属性】
技术研发人员:陈键飞骆天娇诸子钰朱军
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1