人像抠图方法、装置、设备及存储介质制造方法及图纸

技术编号:38991408 阅读:9 留言:0更新日期:2023-10-07 10:21
本申请提出一种人像抠图方法、装置、设备及存储介质,该方法包括:获取训练集,训练集内包含多组训练图像,每组训练图像包括一原始人物图像和对应的标注语义特征图、标注细节特征图和标注融合特征图;构建抠图模型结构,抠图模型结构包含基于注意力机制的细节预测网络;根据训练集,对抠图模型结构进行训练,得到训练好的人像抠图模型。本申请引入注意力机制增强人像抠图模型对人物边缘的细节特征的学习。人像抠图模型的融合网络中融合语义特征及基于注意力机制提取的细节特征,提高融合特征的准确性。使最终的抠图结果图准确性更高,细节部分更精确。还对抠图结果图中的人物前景进行边界平滑处理,使得像素的分类更加准确,人物边缘更加平滑。边缘更加平滑。边缘更加平滑。

【技术实现步骤摘要】
人像抠图方法、装置、设备及存储介质


[0001]本申请属于图像处理
,具体涉及一种人像抠图方法、装置、设备及存储介质。

技术介绍

[0002]人像抠图即预测一个精确的前景蒙版(alpha matte),然后利用它从给定图像或视频中提取人物。这一技术得到了广泛的应用,如照片编辑、图像再创作、证件照生成等。目前,人像抠图,虽然可以实现人像的完整抠取,但是在人像的细节部分,一般会产生一些瑕疵。
[0003]证件照生成,一般是将抠取的人像直接覆盖在同一颜色的背景图上,从而生成证件照;证件照的背景图,由于颜色统一,会对其上覆盖的人像的瑕疵起到放大的作用。因此证件照生成的过程中,对抠取的人像具有了更高的要求。

技术实现思路

[0004]本申请提出人像抠图方法、装置、设备及存储介质,引入注意力机制增强人像抠图模型对人物边缘的细节特征的学习,使训练好的人像抠图模型的抠图准确性更高,细节部分更精确。
[0005]本申请第一方面实施例提出了人像抠图方法,包括:
[0006]获取训练集,所述训练集内包含多组训练图像,每组训练图像包括一原始人物图像和对应的标注语义特征图、标注细节特征图和标注融合特征图;
[0007]构建抠图模型结构,所述抠图模型结构包含基于注意力机制的细节预测网络;
[0008]根据所述训练集,对所述抠图模型结构进行训练,得到训练好的人像抠图模型。
[0009]在本申请的一些实施例中,根据所述训练集,对所述抠图模型结构进行训练,得到训练好的人像抠图模型,包括:
[0010]将所述原始人物图像输入所述抠图模型结构中的语义估计网络,得到对应的语义特征图;
[0011]根据所述语义特征图和所述原始人物图像,通过所述基于注意力机制的细节预测网络获得对应的细节特征图;
[0012]根据所述语义特征图和所述细节预测网络中基于注意力机制的中间特征图,通过所述抠图模型结构中的融合网络获得对应的融合特征图。
[0013]在本申请的一些实施例中,所述根据所述语义特征图和所述原始人物图像,通过所述基于注意力机制的细节预测网络获得对应的细节特征图,包括:
[0014]对所述语义特征图进行上采样;
[0015]根据所述原始人物图像,通过所述细节预测网络包括的注意力机制模块进行特征提取;
[0016]将所述上采样得到的特征图和所述注意力机制模块输出的特征图融合;
[0017]根据所述原始人物图像及所述融合得到的特征图,通过所述细节预测网络获得最终的细节特征图。
[0018]在本申请的一些实施例中,所述根据所述语义特征图和所述细节预测网络中基于注意力机制的中间特征图,通过所述抠图模型结构中的融合网络获得对应的融合特征图,包括:
[0019]在所述抠图模型结构的融合网络中,对所述语义特征图进行上采样;
[0020]将所述上采样得到的特征图和所述细节预测网络中基于注意力机制的中间特征图融合;
[0021]对融合得到的特征图上采样,得到对应的融合特征图。
[0022]在本申请的一些实施例中,所述方法还包括:
[0023]根据所述原始人物图像对应的标注语义特征图、标注细节特征图、标注融合特征图、所述语义特征图、所述细节特征图和所述融合特征图,计算当前训练周期的整体损失值;
[0024]若所述整体损失值达到预设收敛条件,将所述抠图模型结构及当前的模型参数构成训练好的人像抠图模型;
[0025]若所述整体损失值未达到预设收敛条件,则调整当前的模型参数,根据调整后的模型参数继续训练所述抠图模型结构。
[0026]在本申请的一些实施例中,所述得到训练好的人像抠图模型之后,还包括:
[0027]获取待抠图的人物图像;
[0028]将所述人物图像输入所述人像抠图模型,得到所述人物图像对应的语义特征图、细节特征图和融合特征图;
[0029]将所述人物图像对应的所述语义特征图、所述细节特征图和所述融合特征图进行融合,得到所述人物图像对应的抠图结果图。
[0030]在本申请的一些实施例中,所述得到所述人物图像对应的抠图结果图之后,还包括:
[0031]确定所述抠图结果图中的前景边界像素及所述前景边界像素对应的半径;
[0032]以所述前景边界像素为圆心,以所述半径绘制所述前景边界像素对应的圆;
[0033]确定所述前景边界像素所在的抠图区域的质心点;
[0034]若所述质心点位于所述前景边界像素对应的所述圆内,则确定所述前景边界像素为前景像素,否则将所述前景边界像素确定为背景像素。
[0035]在本申请的一些实施例中,所述得到所述人物图像对应的抠图结果图之后,还包括:
[0036]将所述抠图结果图中分类置信度落入预设范围内的像素确定为待处理像素;
[0037]确定所述待处理像素对应的半径;
[0038]以所述待处理像素为圆心,以所述半径绘制所述待处理像素对应的圆;
[0039]确定所述待处理像素所在的抠图区域的质心点;
[0040]若所述质心点位于所述待处理像素对应的所述圆内,则确定所述待处理像素为前景像素,否则将所述待处理像素确定为背景像素。
[0041]在本申请的一些实施例中,所述得到所述人物图像对应的抠图结果图之后,还包
括:
[0042]确定第一像素对应的半径及所述第一像素所在的抠图区域的质心点,所述第一像素为所述抠图结果图中的任一像素;
[0043]以所述第一像素为圆心,以所述半径绘制所述第一像素对应的圆;
[0044]若所述质心点位于所述第一像素对应的所述圆内,则确定所述第一像素为前景像素;
[0045]若所述质心点不位于所述圆内,则保持所述第一像素的分类结果不变。
[0046]本申请第二方面的实施例提供了一种人像抠图装置,包括:
[0047]训练获取模块,用于获取训练集,所述训练集内包含多组训练图像,每组训练图像包括一原始人物图像和对应的标注语义特征图、标注细节特征图和标注融合特征图;
[0048]模型构建模块,用于构建抠图模型结构,所述抠图模型结构包含基于注意力机制的细节预测网络;
[0049]模型训练模块,用于根据所述训练集,对所述抠图模型结构进行训练,得到训练好的人像抠图模型。
[0050]本申请第三方面的实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序以实现上述第一方面所述的方法。
[0051]本申请第四方面的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行实现上述第一方面所述的方法。
[0052]本申请实施例中提供的技术方案,至少具有如下技术效果或优点:
[0053]在本申请实施例中,在人像抠图模型的细节预测网络中增加了注意力机制模块,通过注意力机制模块增本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人像抠图方法,其特征在于,包括:获取训练集,所述训练集内包含多组训练图像;构建抠图模型结构,所述抠图模型结构包含基于注意力机制的细节预测网络;根据所述训练集,对所述抠图模型结构进行训练,得到训练好的人像抠图模型。2.根据权利要求1所述的方法,其特征在于,根据所述训练集,对所述抠图模型结构进行训练,得到训练好的人像抠图模型,包括:将所述原始人物图像输入所述抠图模型结构中的语义估计网络,得到对应的语义特征图;根据所述语义特征图和所述原始人物图像,通过所述基于注意力机制的细节预测网络获得对应的细节特征图;根据所述语义特征图和所述细节预测网络中基于注意力机制的中间特征图,通过所述抠图模型结构中的融合网络获得对应的融合特征图。3.根据权利要求2所述的方法,其特征在于,所述根据所述语义特征图和所述原始人物图像,通过所述基于注意力机制的细节预测网络获得对应的细节特征图,包括:对所述语义特征图进行上采样;根据所述原始人物图像,通过所述细节预测网络包括的注意力机制模块进行特征提取;将所述上采样得到的特征图和所述注意力机制模块输出的特征图融合;根据所述原始人物图像及所述融合得到的特征图,通过所述细节预测网络获得最终的细节特征图。4.根据权利要求2所述的方法,其特征在于,所述根据所述语义特征图和所述细节预测网络中基于注意力机制的中间特征图,通过所述抠图模型结构中的融合网络获得对应的融合特征图,包括:在所述抠图模型结构的融合网络中,对所述语义特征图进行上采样;将所述上采样得到的特征图和所述细节预测网络中基于注意力机制的中间特征图融合;对融合得到的特征图上采样,得到对应的融合特征图。5.根据权利要求2

4任一项所述的方法,其特征在于,每组训练图像包括一原始人物图像和对应的标注语义特征图、标注细节特征图和标注融合特征图;所述方法还包括:根据所述原始人物图像对应的标注语义特征图、标注细节特征图、标注融合特征图、所述语义特征图、所述细节特征图和所述融合特征图,计算当前训练周期的整体损失值;若所述整体损失值达到预设收敛条件,将所述抠图模型结构及当前的模型参数构成训练好的人像抠图模型;若所述整体损失值未达到预设收敛条件,则调整当前的模型参数,根据调整后的模型参数继续训练所述抠图模型结构。6.根据权利要求1

4中任一项所述的方法,其特征在于,所述得到训练好的人像抠图模型之后,还包括:获取待抠图的人物图像;
将所述人物图像输...

【专利技术属性】
技术研发人员:张译友
申请(专利权)人:北京新氧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1