一种基于GAN使用最大化中心模式和微小模式损失解决模式崩塌的方法技术

技术编号:35764200 阅读:26 留言:0更新日期:2022-12-01 14:00
本发明专利技术涉及DCGAN模型和AttnGAN模型,其主要技术特点是:提出一种最大化中心模式和微小模式损失解决模式崩塌问题的方法。通过最大化生成图片的中心模式和微小模式相似度距离,来鼓励生成器探索更多的模式,从而缓解模式崩塌问题。本发明专利技术设计合理,为了验证模型的准确性,采用cifar10和CUB_200_2011作为实验的数据集。通过FID对生成图片的质量进行评估。结果发现,将本发明专利技术提出的损失加入到条件生成模型中,可以有效地改善生成图片的多样性。可以有效地改善生成图片的多样性。可以有效地改善生成图片的多样性。

【技术实现步骤摘要】
一种基于GAN使用最大化中心模式和微小模式损失解决模式崩塌的方法


[0001]本专利技术属于图像生成领域,具体涉及一种使用最大化中心模式和微小模式损失解决模式崩塌的方法。

技术介绍

[0002]自从2014年GAN首次被Goodfellow提出以来,它就表现出极强的能力有效地捕获复杂数据的分布并生成高保真的图片。在生成高分辨率的图像方面,GAN取得了极大的成功。尤其在GAN引入额外的输入后,GANs被快速地应用在各种场景中且都取得了不错的成果。在文本到图像方面(text to image),文本作为附加信息使得最终生成的图片更符合我们所表达的语义;在类生成图像任务中,cGANs可以快速地生成所属类别的图片;在图像到图像(image to image)的转换方面,cGANs表现出了出色的风格迁移能力。
[0003]对于生成图片任务来说,我们期待生成的图片在多样性方面是丰富的,然而几乎所有的cGANs都无可避免的发生多样性不足的现象:模式崩塌。一个不容忽视的原因就是标签c的维度远高于随机噪声的维度,使得生成器G仅关注到标签的信息而忽略了噪声本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于GAN使用最大化中心模式和微小模式损失解决模式崩塌的方法包含以下步骤:步骤一:随机产生满足高斯分布的噪声m组z,随机从标签文件中抽取n个子标签组成c以及并由标签c读取对应的图像集I
train
。步骤二:融合标签c和随机噪声z,将融合得到的结果输入到生成器G中,经过多次上采样得到和真实图像...

【专利技术属性】
技术研发人员:孙志伟马韬
申请(专利权)人:天津科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1