【技术实现步骤摘要】
一种基于半监督学习的多尺度图像翻译方法
[0001]本专利技术涉及图像翻译
,特别涉及,一种基于半监督学习的多尺度图像翻译方法。
技术介绍
[0002]图像翻译是指自动的将图像的一种表示场景变换到另一种场景的任务。目前卷积神经网络被用来作为图像翻译的模型,但对于具体任务的模型构建,其损失函数设计及优化策略都不太相同,大大加重了模型设计的负担。
[0003]通过最小化模型预测和真实标签之间的欧式距离会使模型输出模糊的图像。基于监督学习的图像翻译算法需要大量成对的输入-输出训练数据。现有的图像翻译任务是基于监督学习的模型,需要大量成对的训练数据,然而现实中,获得这种成对的数据很困难,而且成本高昂。
[0004]针对上述问题,设计一种解决不同任务模型构建复杂,模型设计负担重,模型训练学习需要的数据量大的问题的方法,从而实现高效率、高精度的图像翻译。
技术实现思路
[0005]针对上述缺陷,本专利技术解决的技术问题在于,提供一种基于半监督学习的多尺度图像翻译方法,以解决现在技术所存在的不同任务模型构建复杂,模型设计负担重,模型训练学习需要的数据量大的问题。
[0006]本专利技术提供了一种基于半监督学习的多尺度图像翻译方法,具体步骤包括:
[0007]基于多尺度生成对抗网络,根据成对数据监督训练模型;
[0008]基于对偶学习的循环一致性和多尺度生成对抗网络的判别损失,根据非成对数据无监督训练模型,得到高性能图像翻译模型。
[0009]优选地,所述基于多尺 ...
【技术保护点】
【技术特征摘要】
1.一种基于半监督学习的多尺度图像翻译方法,其特征在于,具体步骤包括:基于多尺度生成对抗网络,根据成对数据监督训练模型;基于对偶学习的循环一致性和多尺度生成对抗网络的判别损失,根据非成对数据无监督训练模型,得到高性能图像翻译模型。2.根据权利要求1所述的一种基于半监督学习的多尺度图像翻译方法,其特征在于,所述基于多尺度生成对抗网络,根据成对数据监督训练模型的具体步骤包括:获取由成对图像组成的数据集{x
i
,y
i
},其中x
i
∈X,y
i
∈Y,X和Y为两个相关联的图像域;根据成对图像数据同时监督训练对偶的两个卷积网络模型G和F,卷积网络模型G对应的判别器为D
X
,卷积网络模型F对应的判别器为D
Y
;基于最小化输出与目标的L1距离优化模型;基于对偶的两个卷积网络模型G和F,通过多尺度生成对抗网络的判别器得到生成器的输出与目标域相一致的模型。3.根据权利要求2所述的一种基于半监督学习的多尺度图像翻译方法,其特征在于,所述基于多尺度生成对抗网络的判别损失进行训练的具体步骤包括:通过多个判别器来判别不同尺度的图像,每个判别器D
i
的损失函数为其中x和y分别为数据集中成对的图像数据,G(x)为由生成器生成的尽量服从真实数据x分布的样本,D
i
(y)为判别器D
i
根据y得出的分类概率,D
i
(G(x))为判别器D
i
根据G(x)得出的分类概率;采用取平均值的方法来综合所有判别器损失函数的梯度,得到判别器总的损失函数生成器基于所有判别器损失函数的梯度对模型进行迭代,得到生成器D的损失函数为λ
D
(G,D,x,y)=-∑logD
i
(G(x))+||G(x)-y||1;依据上述步骤交替训练判别器和生成器,得到多尺度生成对抗网络模型。4.根据权利要求3所述的一种基于半监督学习的多尺度图像翻译方法,其特征在于,所述基于对偶的两个卷积网络模型G和F,通过多尺度生成对抗网络训练得到其判别器的损失函数为函数为其生成器的损失函数为λ
G
(G,D
Y
,x,y)=-logD
Y
(G(x))+||G(x)-y||1,λ
F
(F,D
X
,y,x)=-logD
X
(F(y))+||F(y)-x||1,其中D
X
()为判别器D
X
得出的分类概率,D
Y
()为判别器D
Y
得出的分类概率,G()为由生成器生成的尽量服从真实数据x分布的样本,F()为原始图像与生成器...
【专利技术属性】
技术研发人员:冷勇,
申请(专利权)人:北京享云智汇科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。