【技术实现步骤摘要】
通过潜在空间正则化对监督式生成对抗网络进行优化相关申请的交叉引用文件本专利申请要求2019年4月30日提交的第62/840,635号美国临时专利申请,以及2019年8月2日提交的第16/530,692号美国专利申请的优先权,其全部内容通过引用的方式纳入本文。
本专利技术涉及生成对抗网络(GAN),具体领域为GAN的训练方法。
技术介绍
机器学习涉及到计算机在没有明确指令的情况下学习如何执行任务。计算机根据样本数据来构建(如推断出)用于执行任务的模型。当计算机接收到新数据时将使用该模型来执行任务。所述任务可以是分类任务、预测任务、推理任务等。生成对抗网络(GAN)是可用于生成新数据的一类机器学习系统。例如,GAN可用于生成新图像。例如,在超分辨率领域中,GAN可用于通过低分辨率图像来生成高分辨率图像。例如,在修复领域中,GAN可用于重建图像和/或视频中的丢失或受损部分。GAN还可以用在许多其他应用中,例如用于生成逼真的域特定图像(即生成看起来像是真实的图像)。
技术实现思路
一方面, ...
【技术保护点】
1.一种训练生成对抗网络(GAN)的生成器G的方法,包括:/n由编码器E接收目标数据Y;/n由编码器E接收发生器G的输出G(Z),/n其中发生器G在接收作为噪声样本的随机样本Z后随即生成输出G(Z),/n其中GAN的鉴别器D受到训练以区分G(Z)和目标数据Y两者中哪一个是/n真实数据;/n训练编码器E以最小化输出G(Z)的第一潜在空间表示E(G(Z))与目标数据Y的第二潜在空间表示E(Y)之间的差值,其中输出G(Z)和目标数据Y作为输入送至编码器E;以及/n使用第一潜在空间表示E(G(Z))和第二潜在空间表示E(Y)来约束发生器G的训练。/n
【技术特征摘要】
20190430 US 62/840,635;20190802 US 16/530,6921.一种训练生成对抗网络(GAN)的生成器G的方法,包括:
由编码器E接收目标数据Y;
由编码器E接收发生器G的输出G(Z),
其中发生器G在接收作为噪声样本的随机样本Z后随即生成输出G(Z),
其中GAN的鉴别器D受到训练以区分G(Z)和目标数据Y两者中哪一个是
真实数据;
训练编码器E以最小化输出G(Z)的第一潜在空间表示E(G(Z))与目标数据Y的第二潜在空间表示E(Y)之间的差值,其中输出G(Z)和目标数据Y作为输入送至编码器E;以及
使用第一潜在空间表示E(G(Z))和第二潜在空间表示E(Y)来约束发生器G的训练。
2.根据权利要求1所述的方法,还包括:
通过对m个样本递减一个梯度来更新编码器E
其中m个样本包含从数据分布p(z)中选择的m个噪声样本{z1,z2,...,zm}和m个对应的目标样本{y1,y2,...,ym},
其中是在给定编码器E的第一当前权重值θE和第一输入yi时编码器E所得出的第一输出,
其中是在给定发生器G的第二当前权重值θG和第二输入zi时发生器所得出的第二输出,
其中是在将编码器E的第一当前权重值θE和作为输入时编码器E所得出的第三输出。
3.根据权利要求1所述的方法,其中目标数据Y对应于输出G(Z)。
4.根据权利要求1所述的方法,通过应用利普希茨条件来训练生成器G,以使输出G(Z)和目标数据Y之间的第一差值不超过第一潜在空间表示E(G(Z))和第二潜在空间表示E(Y)之间的第二差值。
5.根据权利要求1所述的方法,
其中编码器E是一个包含一个放大层的神经网络,并且
其中编码器E的输出E(G(Z))和E(Y)所具有的第一大小与Z的第二大小相等。
6.根据权利要求1所述的方法,其中随机样本Z是从分布p(z)中选出的值的多维向量。
7.根据权利要求1所述的方法,其中使用第一潜在空间表示E(G(Z))和第二潜在空间表示E(Y)来约束发生器G的训练包括:
通过对m个样本递减一个梯度来更新发生器G
其中θD,θG和θE分别是鉴别器D、发生器G和编码器E的权重,
其中是在输入为zi时发生器G的输出,
其中当输入为时,和分别为鉴别器D和编码器E的输出,
其中是目标数据为yi时编码器E的输出,并且
其中μ1和μ2是超参数。
8.一种用于训练生成对抗网络(GAN)中的生成器G的设备,包括:
一个存储器,和
一台处理器,处理器被配置为可执行存储器中的指令用于:
向编码器E输入目标数据Y;
向编码器E输入发生器G的输出G(Z);
其中发生器G在接收到随机样本Z后生成输出G(Z),并且
其中GAN的鉴别器D受到训练以区分G(...
【专利技术属性】
技术研发人员:钟声,
申请(专利权)人:达音网络科技上海有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。