基于多视角的大面积图像修复方法技术

技术编号：40021806 阅读：27 留言：0更新日期：2024-01-16 16:52

本发明专利技术提出了一种基于多视角的大面积图像修复方法，该方法采用了两个方向的的引导图像，通过特征对齐得到破损图像要修复区域的特征信息，以加强图像破损区域较大时的修复能力。所提出的方法利用3个相同结构的编码器获取两个方向的引导图像与破损图像的纹理特征与结构特征，再通过特征对齐网络将多个纹理特征与结构特征分别进行特征对齐，最后通过特征均衡化处理，保证特征融合后的色彩域与空间域特征的一致性，把输出的特征与解码器相连接，得到修复的结果。所提出的基于多视角的图像修复方法引入梯度重建损失函数，减少修复结果的伪影，提高修复质量。此外，所提出的方法的数据集是本发明专利技术自主采集整理及构建的。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术为一种涉及游客拍照去除复杂背景的多视角大面积图像修复方法。

技术介绍

1、随着人民生活的提高，越来越多人选择旅游，当游客拍照打卡一个景点时，往往会有很多其他游客入镜，照片取景变得杂乱，通过图像修复技术可以帮助游客移除照片中不想要的对象，保留自己想要的对象，获得一张质量高的满意图像。

2、基于扩散技术的图像修复方法将邻域外观传播到缺失区域。然而，它们只考虑缺失区域的周围像素，这只能处理背景修复任务中的小孔，并且可能无法生成有意义的结构。相反，基于补丁的方法通过将相似和相关的补丁从剩余图像区域转移到空穴区域来填充缺失区域。尽管这些方法在处理背景修复任务上的小孔方面表现良好，但它们无法生成语义上有意义的内容。当空洞区域很大时，这些方法缺乏语义指导。基于深度学习的图像修复通常涉及生成对抗性网络，以补充空洞填充的视觉感知指导。后来有研究者提出了局部和全局鉴别器，并辅以扩张卷积来提高修复质量。有研究者介绍了一种结构感知网络，该网络将修复任务分为两部分：结构重建和纹理生成。在2019年有研究者提出了门控卷积的概念，该门控卷积学习...

【技术保护点】

1.基于多视角的大面积图像修复方法，其特征在于，它利用了一张破损图像与额外的两张引导图像对和引入梯度加权重建损失函数去更好地修复破损图像：

2.基于多视角的大面积图像修复方法其特征在于它有3个相同网络结构的编码器，参数并不共享，同时还有一个解码器，其中编码器是有6个卷积层，采用的是Unet网络，定义一个跳跃连接块，由一个4*4的卷积操作、LeakyReLU操作及BatchNorm2d组成，编码器的每一层卷积操作由跳跃连接块组成，其中编码器的第一层卷积块由LeakyReLU操作与4*4卷积操作组成，中间的4层卷积块是由LeakyReLU操作、4*4卷积操作与BatchNorm2...

【技术特征摘要】

2.基于多视角的大面积图像修复方法其特征在于它有3个相同网络结构的编码器，参数并不共享，同时还有一个解码器，其中编码器是有6个卷积层，采用的是unet网络，定义一个跳跃连接块，由一个4*4的卷积操作、leakyrelu操作及batchnorm2d组成，编码器的每一层卷积操作由跳跃连接块组成，其中编码器的第一层卷积块由leakyrelu操作与4*4卷积操作组成，中间的4层卷积块是由leakyrelu操作、4*4卷积操作与batchnorm2d组成，最后一层卷积块只有4*4的卷积操作，编码器前面3层卷积块操作得到图像的浅层特征信息，即纹理特征，后面3层卷积块操作得到图像的深层特征信息，即结构特征；解码器有5层卷积块，同样内部定义一个跳跃连接块，由relu、tanh操作、batchnorm2d操作及一个4*4的转置卷积操作组成，解码器的前面4层卷积块由跳跃连接块定义的relu操作、4*4转置卷积操作及batchnorm2d操作组成，解码器最后一层与前面4层相比，多加一个t...

【专利技术属性】
技术研发人员：李博洋，刘艳丽，邢冠宇，
申请(专利权)人：四川大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人