一种基于跨通道融合空间注意力机制的高清图像翻译方法技术

技术编号：34898377 阅读：39 留言：0更新日期：2022-09-10 13:58

本发明专利技术涉及一种基于跨通道融合空间注意力机制的高清图像翻译方法，包括如下步骤：S1:选用原图数据集X，并预设目标域类别标签集C；S2:构建基于跨通道融合空间注意力机制的高清图像翻译模型M；S3：将选取的图片输入生成器中得到生成图像；S4:再将生成图像y

全部详细技术资料下载

【技术实现步骤摘要】
一种基于跨通道融合空间注意力机制的高清图像翻译方法

[0001]本专利技术涉及高清图像翻译领域，特别涉及一种基于跨通道融合空间注意力机制的高清图像翻译方法。

技术介绍

[0002]当前图像作为最直接和便捷的信息载体，备受人们的青睐，这驱使了计算机视觉相关工作需要以更具创新和更大格局的发展态势。图像翻译技术作为计算机视觉领域的关键技术之一，得益于它的高价值和高可用性，备受越来越多的研究者关注。图像翻译技术旨在通过学习原始图像到目标图像的映射关系使得图像内容中某个属性的转换。一对一映射关系的图像翻译技术是目前的主流方法，但是在面对多组图像数据时，需要依据图像转换样式的数量来训练多个模型，其可扩展性和鲁棒性都有待提高，目前一对多映射关系的图像翻译模型可以很好地解决训练模型冗余的问题，但目前所公开的该类模型又大多关注低分辨率图像转换任务，转换结果存在背景污染和纹理细节丢失的缺陷，并不适用于多样式高清图像翻译任务。
[0003]当下的图像翻译的概念跟语言翻译的概念相通，即从某一个特定的领域转换到另一个特定的目标域，通过对图像内容中某个属性的改变去逼近目标图像内容的特定属性，如将普通马转换成斑马，山水画转换成油画等；并且当一对一映射关系图像翻译技术在面对多组图像数据时，需要依据图像数据的数量来训练多个网络模型，加大工作量的同时也会出现资源上的浪费。
[0004]目前图像翻译技术应用在许多方面并产生了很多成果，但是依然面临许多挑战：一是大多数图像翻译采用的数据都是低分辨率图像，图像成像质量较低，纹理细节保留较少，而...

【技术保护点】

【技术特征摘要】
1.一种基于跨通道融合空间注意力机制的高清图像翻译方法，其特征在于：包括如下步骤：S100：选用公开真实照片作为原图数据集X，并预设目标域类别标签集C，原图数据集X中为带有真实类别标签的图像数据，目标域类别标签集C中包括Q种样式的人物写真风格类型的类别标签；S200：构建基于跨通道融合空间注意力机制的高清图像翻译模型M，基于跨通道融合空间注意力机制的高清图像翻译模型M包括基于跨通道融合空间注意力机制的生成器和基于跨通道融合空间注意力机制的判别器；所述生成器包括4个模块，依次为下采样模块、跨通道融合空间注意力机制模块、基于跨通道融合空间注意力机制的大残差嵌套小残差模块和上采样模块；S300：令i＝1；从X中选取第i张图片x
i
，将x
i
与C所包含的所有标签拼接在一起输入生成器中得到生成图像y
i
，即G(x
i
，C)
→
y
i
，具体步骤如下：S310：将x
i
输入到下采样模块中，得到第i张图片对应的特征图F
i
，下采样模块包含有3个卷积层，每个卷积层分别对应一个实例规范化层；S320：将特征图F
i
输入跨通道融合空间注意力机制模块得到特征图Fcs
i
，跨通道融合空间注意力机制模块记为CSA，具体步骤如下：S321：将特征图F
i
输入CSA中得到特征图Fc
i
，将特征图Fc
i
进行平均池化处理得到平均池化表征；S322：将特征图Fc
i
进行最大池化处理得到最大池化表征，所述平均池化表征和最大池化表征均为特征图长宽减半和特征图维度为2的空间表示；S323：将特征图Fc
i
的平均池化表征和特征图Fc
i
的最大池化表征进行连接，将连接结果输入到转置卷积网络中，最后将转置卷积网络的输出结果进行Sigmoid激活函数的激活处理，得到特征图Fcs
i
，其中，转置卷积网络的步长大小为2、卷积核大小为4；S330：将特征图Fcs
i
输入到基于跨通道融合空间注意力机制的大残差嵌套小残差模块中得到特征图Fr
i
，基于跨通道融合空间注意力机制的大残差嵌套小残差模块记为CSRIR，所述CSRIR包括G个大残差块，每个大残差块包含B个基于跨通道融合空间注意力机制的小残差块，基于跨通道融合空间注意力机制的小残差块记为RCSA；S340：采用CSA模块对特征图Fr
i
进行处理，将处理结果输入上采样模块，得到生成图像y
i
；S400：将生成图像y
i
输入到基于跨通道融合空间注意力机制的判别器中，得到生成图像y
i
的真实性D
src
(x
i
)和生成图像y
i
对应的图像类别D
cls
(c|G(x
i
，C))；S500：将生成图像y
i
与目标域标签集C所包含的所有标签拼接在一起输入到的生成器中得到生成图像y
′
i
；S510：将生成图像y
′
i
输入到基于跨通道融合空间注意力机制的判别器中，得到生成图像y
′
i
对应的图像类别S520：计算M的生成器总损失函数和判别器总损失函数，所述生成器总损失函数和判别器总损失函数，具体步骤如下：S521：采用带有梯度惩罚的WassersteinGAN目标损失作为M的对抗性损失函数表
达式如下：y
i
＝G
src
(x
i
，C)...

【专利技术属性】
技术研发人员：张欣，杨梦宁，简坤元，龙超，邓植夫，柴海洋，
申请(专利权)人：重庆大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人