【技术实现步骤摘要】
基于生成对抗网络的跨视角图像翻译方法
[0001]本专利技术属于人工智能、计算机视觉
,具体涉及一种基于生成对抗网络的跨视角图像翻译方法。
技术介绍
[0002]近年来,人工智能和深度学习技术在计算机视觉领域得到了广泛应用,生成对抗网络被广泛用于图像生成任务中。一般来说,基于生成对抗网络的技术大多专注于自然图像生成、图像超分辨率、图像风格迁移、面部图像转换等任务。尽管这些工作取得了令人印象深刻的效果,但这些工作仍未能将图像翻译任务扩展到跨视角场景。
[0003]得益于生成对抗网络的快速发展,基于生成对抗网络的图像翻译任务得到了广泛的研究。跨视角图像翻译是针对同一地点,空中和地面两个不同视角的场景图像转换,它同时涉及到语义和外观两个层面的翻译。此任务近年来受到越来越多的关注。
[0004]虽然现有工作在跨视角图像翻译任务上取得了一些成果,但目前仍存在较多问题。首先,其仅能生成小部分固定视角的地面图像,且生成的地面视角图像无法保留空中视角图像丰富的语义信息。其次,现有工作忽略的图像翻译的生成多样性,将图像翻译变成了确定性的一对一映射任务,但空中视角图像在向地面视角图像转化时,由于遮挡、噪声和旋转等因素,可能呈现出不同的外观风格。因此,从空中视角图像生成多样化的地面图像更接近真实的情况。最后,现有工作的生成结果容易产生伪影和模糊的现象,原因是地面视角图像中对物体的外观的描述比空中视角图像更加详细。
技术实现思路
[0005]针对现有技术的不足,本专利技术的目的在于提供一种基于生成对抗网 ...
【技术保护点】
【技术特征摘要】
1.一种基于生成对抗网络的跨视角图像翻译方法,其特征在于,包括以下步骤:1)构建图像翻译网络图像翻译网络包括跨视角图像生成器G
coarse
、多尺度鉴别器D
s
、编码器E和残差估计网络;跨视角图像生成器G
coarse
选用U
‑
net网络作为骨干网络,接受空中视角图像I
a
、全景语义图像S
pano
为输入,合成粗糙的地面全景图像I
′
pano
;残差估计网络由残差图生成器和残差图鉴别器D
r
组成,残差图生成器由多个残差细化模块R
i
依次级联而成,残差细化模块R
i
由多层卷积神经网络组成,用以预测输入图像的残差图,并通过将跨视角图像生成器G
coarse
和残差图求和,进一步合成细化精炼的地面全景图像经过残差细化模块,残差估计网络生成最终细化的地面全景图像I
″
pano
,残差图鉴别器D
r
用来判断各个残差细化模块R
i
生成残差图的真实性,并将结果反馈给残差细化模块R
i
;多尺度鉴别器D
s
以不同尺度图像块判断真实地面图像I
pano
和最终细化的地面全景图像I
″
pano
的真实性,并将结果反馈给跨视角图像生成器G
coarse
和残差估计网络;编码器E由数层基于残差的卷积神经网络组成,其作用为将输入图像编码为接近高斯分布的潜码z
rec
,以实现网络的多样化生成;2)训练阶段同时对图像翻译网络进行两个模式的训练;第一种训练模式中,将真实地面图像I
pano
作为编码器E的输入生成的符合高斯分布的潜码z
e
、空中视角图像I
a
、全景语义图像S
pano
输入图像翻译网络中进行训练;在第二种训练模式中,采用随机采样的潜码z
r
合并空中视角图像I
pano
、全景语义图像S
pano
输入图像翻译网络进行训练,编码器E连接在图像翻译网络的末端,从生成的图像I
″
pano
生成重构潜码z
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。