当前位置: 首页 > 专利查询>清华大学专利>正文

一种人像抠图方法及系统技术方案

技术编号:34284924 阅读:43 留言:0更新日期:2022-07-27 08:12
本发明专利技术提供一种人像抠图方法及系统,该方法包括:获取待抠图的目标人像图片;将目标人像图片输入到训练好的深度神经网络模型中,输出得到目标人像图片中的人像前景,其中,训练好的深度神经网络模型是由标记有不透明度的样本人像图片和样本人像图片对应的样本三色图,对深度神经网络模型进行训练得到的。本发明专利技术提升了全自动人像抠图的精确度,使得处理大批量人像数据的效率提高,并且将分割与抠图步骤合并到一个统一的深度神经网络中,从而避免了传统的三色图交互方法中需要大量交互绘制工作量的弊端。工作量的弊端。工作量的弊端。

【技术实现步骤摘要】
一种人像抠图方法及系统


[0001]本专利技术涉及图像处理
,尤其涉及一种人像抠图方法及系统。

技术介绍

[0002]自然图像抠图旨在将图像拆分成一个前景层和一个背景层,这两层之间通过一组不透明度值系数进行加权组合得到原始图像。对图像进行像素级别的精确前景估计,在图像合成的各种应用中是非常重要的一步。
[0003]现有的自然图像抠图算法,往往需要用户输入一个三色图(trimap)指定前景区域(不透明度为1),背景区域(不透明度为0)和未知区域(不透明度待定)。算法可以借助指定的前景和背景的信息进行建模,以确定未知区域的不透明度值。然而,在实际应用场景中,三色图的提取并不容易,研究中使用的测试图片因为有标注好的准确不透明度值,可以通过腐蚀膨胀操作生成三色图。而对一般的图片,要获取高质量的三色图只能通过大量的手工交互,使得抠图的效率大大降低。
[0004]使用大量数据训练深度神经网络,使得不需要三色图输入的自动抠图算法成为可能。然而,深度神经网络对于前景物体的分割并不总是完全准确的,训练数据与测试数据的差异,图片前景的歧义性都本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种人像抠图方法,其特征在于,包括:获取待抠图的目标人像图片;将所述目标人像图片输入到训练好的深度神经网络模型中,输出得到所述目标人像图片中的人像前景,其中,所述训练好的深度神经网络模型是由标记有不透明度的样本人像图片和所述样本人像图片对应的样本三色图,对深度神经网络模型进行训练得到的。2.根据权利要求1所述的人像抠图方法,其特征在于,所述训练好的深度神经网络模型通过以下步骤得到:获取标记有不透明度的样本人像图片;根据所述样本人像图片,得到每张样本人像图片在不同交互场景类型中的样本三色图;根据所述样本人像图片和所述样本三色图,构建训练样本集;将所述训练样本集输入到深度神经网络模型进行训练,得到训练好的深度神经网络模型。3.根据权利要求2所述的人像抠图方法,其特征在于,所述根据所述样本人像图片,得到每张样本人像图片在不同交互场景类型中的样本三色图,包括:对样本人像图片对应的人像抠图结果进行腐蚀膨胀处理,得到第一样本三色图;获取所述样本人像图片对应的样本三色图,将标记有前景标记块和背景标记块的样本三色图作为第二样本三色图,将包含有与标记数据不一致的前景标记块或背景标记块的样本三色图作为第三样本三色图,将所有像素标记为未知类型的样本三色图作为第四样本三色图;根据所述第一样本三色图、所述第二样本三色图、所述第三样本三色图和所述第四样本三色图,得到每张样本人像图片在不同交互场景类型中的样本三色图。4.根据权利要求2所述的人像抠图方法,其特征在于,所述将所述训练样本集输入到深度神经网络模型进行训练,得到训练好的深度神经网络模型,包括:将所述训练样本集输入到深度神经网络模型进行编码和解码的逐层训练,具体包括:通过第一编码器,对所述样本人像图片进行深度特征提取,得到样本深度特征;将所述样本三色图对应的距离变换图、所述样本人像图片、所述样本三色图和所述样本深度特征输入到第二编码器,得到对应的残差特征;根据所述残差特征对所述样本深度特征进行修正,并将修正后的样本深度...

【专利技术属性】
技术研发人员:胡事民方晓楠张松海吴现
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1