【技术实现步骤摘要】
基于前背景解耦的抠图方法
[0001]本专利技术属于图像抠图领域,具体涉及一种基于前背景解耦的抠图方法。
技术介绍
[0002]图像抠图是假设输入图像是一张由前景图像F和背景图像B通过线性组合而成的图像I,如下所示:
[0003]I=α
i
*F
i
+(1
‑
α
i
)*B
i
[0004]其中α∈[0,1],i是像素索引。图像抠图的目的是提取具有复杂毛发细节和多样化外观挑战的特定前景。图像抠图在现实场景中有很多应用,如视频编辑和海报制作。
[0005]从图像I中预测前景图像F、背景图像B和α值是一个典型的不适应问题。
[0006]目前,图像抠图领域常见的做法是引入额外的输入作为辅助信息,例如,修饰、涂鸦和背景。然而,额外输入的产生通常需要手工操作,这限制了现实世界中的使用场景。例如,不可能手动为视频会议的实时消光提供修剪,而且用户很难在移动终端上绘制修剪。
[0007]为了摆脱对额外输入的依赖,最近出现了一些无额外输入的方法。例如,TOM
‑
Net
[1]将物体掩膜、衰减掩膜和由编码器
‑
解码器网络产生的折射流场连接起来,以产生一个粗略的预测,然后它使用一个剩余网络进行细化。U2Net
[2]设计了一个两级嵌套的U形结构,可以破解更多的背景信息。HAttMatting
[3]采用空间和通道注意力来整合外观线索和金字塔特征,可以从细化的边界和适 ...
【技术保护点】
【技术特征摘要】
1.一种基于前背景解耦的抠图方法,其特征在于,首先,提出分解子任务集,包括前景分割任务、背景分割任务和消除歧义任务;其次,在分解子任务集启发下,提出前景
‑
背景解耦抠图网络FBDM,即通过嵌套注意力机制来解耦主干特征,而后通过主干特征利用两个独立的渐进式语义解码器来完成前景分割任务和背景分割任务,最后采用分频局部消歧模块,分别预测低频和高频信息以矫正不同频域的错误。2.根据权利要求1所述的基于前背景解耦的抠图方法,其特征在于,所述前景分割任务和背景分割任务是并行的,而前景分割任务、背景分割任务和消除歧义任务是串行的。3.根据权利要求1所述的基于前背景解耦的抠图方法,其特征在于,所述前景
‑
背景解耦抠图网络FBDM由一个主干网络、两个平行的语义分支和一个按照设定的子任务的消歧分支组成,两个带有1
×
1的卷积的预测头从主干网络中输出的最高层次语义特征输入,用来预测粗略的前景和背景图像,即粗略的语义信息;粗略的语义信息的损失为:其中,和是前景预测器和背景预测器的预测值,和是前景分割和背景分割的标签,是粗略前景的有监督损失,是粗略背景的有监督损失;L
S(
·
,
·
)
是二元交叉熵值损失,如下:其中,H和W是预测图像的长和宽,p
i
∈[0,1],y
i
∈[0,1]。4.根据权利要求1所述的基于前背景解耦的抠图方法,其特征在于,前景
‑
背景解耦抠图网络FBDM的主干网络中每一层的特征图E
i
输入嵌套注意力机制得到新特征图E'
i
;所述嵌套注意力机制由一个内部自注意和一个外部自注意组成,它们分别以图像块和层为单位;对于内部自注意,在主干特征中加入一个GAU层来学习内部层的图像块之间的长距离依赖,为减少计算量,利用一个自适应平均池层,在GAU层之前将特征的大小缩减到1/16元,然后用双线性插值来恢复到原始大小;对于外部自注意,通过粗略语义p
e
的指导,引入掩码自注意机制,以学习不同层次层的关系;通过掩码自理计算的新特征图E'
i
描述如下:其中,K为主干网络层的数量,E
i
为第i层主干网络输出的特征图,V
j
为第j层的内部自注意的结果,Q
i
和K
i
是对特征图E
i
插值之后通过线性层得来的,Linear()代表线性层操作,为第i层特征图的高,为第i层特征图的宽。5.根据权利要求3所述的基于前背景解耦的抠图方法,其特征在于,所述语义解码器首先将解码层的特征缩放为两倍大小,然后使用卷积核大小为1
×
1的卷积,按照跳过连接的方法融合编码特征和调整后的特征;为挖掘上下文信息,在前景和背景分支的最高级别特征之后插入一个ASPP层;所述...
【专利技术属性】
技术研发人员:李佐勇,吴嘉炜,许惠亮,郑祥盘,姚少扬,
申请(专利权)人:闽江学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。