基于编解码器网络和引导图的抠图方法技术

技术编号：31581003 阅读：14 留言：0更新日期：2021-12-25 11:24

一种基于编解码器网络和引导图的抠图方法，根据原图绘制一张引导图并通过编解码器网络进行第一次预测得到前景蒙版，根据预测的前景蒙版对原引导图进行修改并由编解码器网络再次进行预测，循环往复直到获得精确抠图结果。本发明专利技术通过三元图、草图、点击图或全灰输入作为引导图均可以通过简单操作实现精确抠图。作为引导图均可以通过简单操作实现精确抠图。作为引导图均可以通过简单操作实现精确抠图。

全部详细技术资料下载

【技术实现步骤摘要】
基于编解码器网络和引导图的抠图方法

[0001]本专利技术涉及的是一种图像处理领域的技术，具体是一种基于编解码器网络和引导图的抠图方法。

技术介绍

[0002]抠图(Image Matting)是通过输入的图像产生一个前景蒙版用于将前景物体(要抠出的物体)与背景分离，一般抠图问题被建模为求解公式I
i
＝α
i
F
i
+(1
‑
α
i
)B
i
，其中α∈[0，1]，I表示的是输入图像(三通道)，α(单通道)表示的是前景蒙版，F和B(三通道)分别表示前景和背景区域，i表示的是每个像素点的位置；为求解这个方程，就需要引入额外的约束，一般的约束有三元图(trimap)或草图(scribbles)等。当前的抠图方法主要是基于深度学习的方法，这些方法的精度要明显优于传统的基于采样的和基于传播的方法。大多数抠图方法使用一个手绘的三元图作为引导图来提供引导信息，绘制三元图较为耗时，对用户输入不友好，三元图使用白色(值为1)，灰色(值为0.5)和黑色(值为0)的区域分别表示前景、过渡区域和背景区域。草图(scribblemap)和点击图(clickmap)同理，只是草图使用的是黑色和白色的曲线，相比三元图给定的信息要少，点击图使用的是圆，提供的信息更少，对神经网络的要求更高，但是对人工输入来说更加方便。在过去几年中，绝大多数的抠图方法使用的都是三元图并且取得较高的精度。

技术实现思路

[0003]本专利技术针对现有基...

【技术保护点】

【技术特征摘要】
1.一种基于编解码器网络和引导图的抠图方法，其特征在于，根据原图绘制一张引导图并通过编解码器网络进行第一次预测得到前景蒙版，根据预测的前景蒙版对原引导图进行修改并由编解码器网络再次进行预测，循环往复直到获得精确前景蒙版，随后通过精确前景蒙版和输入图像获得要抠出的前景；所述的编解码器网络包括：编码器、语义信息融合模块、跳跃连接模块和解码器，其中：编码器从输入图像和引导图在通道上连接而成的输入特征图中分别提取出多尺度深层特征图并输出至语义信息融合模块、提取出多尺度浅层特征图并通过跳跃连接模块输出至解码器；语义信息融合模块根据多尺度深层特征图进行特征融合与上采样，得到包含前景的轮廓信...

【专利技术属性】
技术研发人员：程航，徐树公，
申请(专利权)人：上海大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人