一种基于生成对抗网络的无监督多模态图像转换方法技术

技术编号：29405888 阅读：165 留言：0更新日期：2021-07-23 22:44

一种基于生成对抗网络的无监督多模态图像转换方法，包括以下步骤：1)同时输入属于A域图像x

全部详细技术资料下载

【技术实现步骤摘要】
一种基于生成对抗网络的无监督多模态图像转换方法
本专利技术属于深度学习中的生成对抗网络领域，并引入了注意力机制，是一种实现了无监督多模态图像转换的方法。
技术介绍
深度学习是机器学习的子领域，它使用了多层次的非线性信息处理和抽象，用于有监督、无监督、半监督、自监督、弱监督等的特征学习、表示、分类、回归和模式识别等。近年来，深度神经网络在监督学习中取得了巨大的成功，此外，深度学习模型在无监督、混合和强化学习方面也非常成功。因为缺乏足够的先验知识，因此难以人工标注或标注成本太高，我们希望计算机能够代替我们完成这些工作或提供一些帮助，因此无监督学习在近些年获得了很大的发展，这也是深度学习领域未来发展的方向。深度学习技术也越来越受到研究者的重视，并已成功地应用于许多实际应用中。而在生成对抗网络(GAN)的应用方面，近年来也是深度学习领域中一个热门的研究课题，也是迄今为止最成功的生成模型。2014年至今，人们对GAN进行了广泛的研究，并提出了大量算法，GAN由两个网络组成：一个生成器合一个判别器，分别负责伪造图片和识别图片真假。生成器产生图像的目的是诱使判别器相信它们是真实的，同时，判别器会因为发现假图片而获得奖励。通过两者的相互博弈，共同提高性能。GAN在图像处理与计算机视觉、自然语言处理、语音与音频、医学以及数据科学中都有着广泛的应用。近几年，注意力机制不管在自然语言处理还是在计算机视觉领域中，都是热门的研究方向。许多学者也提出了若干种注意力机制来提高模型的相关任务的性能。计算机视觉中的注意力机制的基本思想...

【技术保护点】
1.一种基于生成对抗网络的无监督多模态图像转换方法，其特征在于：所述方法包括以下步骤：/n1)输入属于A域的图像x

【技术特征摘要】
1.一种基于生成对抗网络的无监督多模态图像转换方法，其特征在于：所述方法包括以下步骤：
1)输入属于A域的图像xa以及属于B域的图像xb进入图像跨域转换神经网络中进行训练，图像跨域转换神经网络为包含了生成器与判别器的生成对抗网络；
2)编码器将图像拆分编码为图像内容编码c以及域风格编码s；
3)针对不同的域图像配置不同的特定域编码m；
4)将内容编码c、域风格编码s和特定域编码m融合并解码，生成指定目标域图像，若将A域图像xa作为源域，则转换生成B目标域图像xa-→b，若将B域图像xb作为源域，则转换生成A目标域图像xb-→a；
5)判别器对生成器生成的图像进行质量评判，区分输入判别器的图像是真实图像或网络生成的假图像；
6)将步骤1)～5)不断重复设定的次数，生成器与判别器不断相互博弈，共同提高性能，直到网络收敛。

2.如权利要求1所述的一种基于生成对抗网络的无监督多模态图像转换方法，其特征在于：使用分配的域特定编码，仅使用一组生成器即可完成其他目标域图像的生成。

3.如权利要求2所述的一种基于生成对抗网络的无监督多模态图像转换方法，其特征在于：使用的域特定编...

【专利技术属性】
技术研发人员：周乾伟，刘一波，胡海根，李小薪，周晨，陶俊，吴延壮，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人