一种基于注意力机制的递归推理图像修复方法技术

技术编号：30782637 阅读：7 留言：0更新日期：2021-11-16 07:43

本发明专利技术公开了一种基于注意力机制的递归推理图像修复方法，包括获取待处理图像Y和mask图像；将待处理图像Y和mask图像进行组合，并通过stride为2的局部卷积操作得到存在遮掩区域固定通道数的特征图X；使用递归推理模块对特征图X和mask图像进行处理，得到特征图集合F和遮掩图集合M；采用自适应函数合并特征图集合F中的所有特征图，得到新的特征图R；对特征图R进行上采样操作，得到修复后的图像。本发明专利技术能够实现精确、高效的图像修复。高效的图像修复。高效的图像修复。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于注意力机制的递归推理图像修复方法

[0001]本申请属于图像处理
，具体涉及一种基于注意力机制的递归推理图像修复方法。

技术介绍

[0002]图像修复是计算机视觉和图像处理领域的一个重要研究内容。随着深度学习在视觉领域的优秀表现，视觉领域的前沿基本被深度学习技术所占据。而图形学和视觉领域的交叉部分更是讨论研究的热点，特别是图像编辑和图像生成这两个方面。其中图像修复可以简单概述为一个缺失部位的估计值问题，现如今如何高效修复大面积、不规则的图像仍是一个亟待提高解决的问题。
[0003]近些年，许多学者也在深度学习图像修复领域贡献了很多的算法，这里主要概括为三类：1)卷积网络图像修复方法；2)边界渐进修复算法；3)基于注意力机制的修复算法。像Guilin Liu等人提出的部分卷积网络可以进行不规则破损图像的修复，向较远区域借用特征块，但是这些方法没有考虑到语义歧义的问题，只要是面对大孔洞的破损图像就会因为破损中心的和已知区域的相关性减弱，从而导致产生语义上的误差。Wei Xiong等人利用渐进的方式先修复破损部位的边界部分，逐步增加对孔中间部位的约束，最终实现了图像的修复，但是由于计算成本偏大，而且部分信息在解码过程中迭代次数较多导致信息失真。后来又提出了一种基于注意力机制的修复方式，从背景图中高精度提取适合的纹理，但该方法依旧没有考虑到不同递归循环时提取到特征之间的关系，造成修复的部分精确度欠佳。

技术实现思路

[0004]本申请的目的在于提供一种基于注意力机制的递归推理图像修复方法...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的递归推理图像修复方法，其特征在于，所述基于注意力机制的递归推理图像修复方法，包括：步骤S1、获取待处理图像Y和mask图像；步骤S2、将待处理图像Y和mask图像进行组合，并通过stride为2的局部卷积操作得到存在遮掩区域固定通道数的特征图X；步骤S3、使用递归推理模块对特征图X和mask图像进行处理，得到特征图集合F和遮掩图集合M，包括：步骤S31、对特征图X进行stride为1的局部卷积操作得到特征图X1，同时利用识别区域函数和更新函数对mask图像进行处理生成mask1图像，根据mask图像和mask1图像确定待填充区域，并把mask1加入遮掩图集合M；步骤S32、对特征图X1进行卷积核尺寸为3*3的两次stride为2、padding为1的卷积操作以及卷积核尺寸为3*3的三次stride为1、padding为2的卷积操作得到固定通道数的特征图X2至X6；步骤S33、对特征图X1分别进行三次降采样操作得到全局图K1、K2和K3，并对全局图K3进行三次卷积核为3*3的卷积操作分别得到特征图K31、K32和K33，再计算特征图K31、K32、K33的注意力分数得到注意力图A31、A32、A33；在垂直方向上，以全局图K2作为输入，对全局图K2进行stride为1、卷积核为3*3的卷积操作得到特征图K21，并根据注意力图A31的注意力分数填充特征图K21中的待填充区域得到新的图L31，计算图L31的注意力分数得到注意力图A21，以图L31作为输入同理得到图L32和A22，以图L32作为输入同理得到图L33和A23，并对图L33进行stride为1、卷积核为3*3的卷积操作得到特征图K24，计算特征图K24的注意力分数得到注意力图A24；在水平方向上，对全局图K1进行stride为1、卷积核为3*3的卷积操作得到特征图K11，并根据注意力图A21的注意力分数填充特征图K11中的待填充区域得到新的图L21，计算图L21的注意力分数得到注意力图A11，以图L21作为下一层的输入同理得到注意力图A12、A13、A14、A15；步骤S34、特征图X6根据注意力图A15填充待填充区域后经过转置卷积操作生成图Z5，图Z5和特征图X5桥接组合成一个特征图R5，特征图R5作为输入同理得到图Z4、Z3、Z2、Z1，并根据图Z1计算得到本次循环的注意力分数；步骤S35、判断在待填充区域中相同像素点坐标处上次循环是否存在注意力分数，若存在则加权组合该像素点坐标处本次循环...

【专利技术属性】
技术研发人员：郑建炜，吴杰，楼柯辰，刘豪，李鹏飞，谷雨斌，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人