【技术实现步骤摘要】
一种基于混合标注数据的人像抠图方法
[0001]本专利技术涉及图像处理的
,特别涉及一种基于混合标注数据的人像抠图方法。
技术介绍
[0002]人像抠图技术预测透明度掩膜alphamatte的技术,alphamatte中白色区域代表图像的前景部分,黑色区域代表图像背景部分,预测出alphamatte就可以把人像的前景或背景抠出来,实现人像抠图。
[0003]目前,人像抠图方法主要分为传统人像抠图和深度学习人像抠图,传统人像抠图方法通常采用RGB图像和其他辅助作为输入,通过预测alphamatte实现人像抠图,其他辅助一般为trimap或scribbles,trimap是将图像粗略分割为前景、背景和过渡区域,scribbles是表示属于前景或背景的少量像素。为了进一步提高人像抠图的效率,人们将深度学习技术引入人像抠图,使得深度学习技术成为提取人像抠图最有效的方法。如Xu等人在2017年采用类似VGG的深度学习模型,通过使用RGB图像和trimap直接预测alphamatte,这被认为是深度学习matting的先驱 ...
【技术保护点】
【技术特征摘要】
1.一种基于混合标注数据的人像抠图方法,其特征在于,包括以下步骤:S1.获取设有监督信号的混合标注图像数据集;S2.对混合标注图像数据集进行预处理;S3.构建用于对图像特征进行识别提取融合以及对混合标注图像数据集的监督信号进行更新的人像抠图神经网络模型;S4.将混合标注图像数据集划分为训练集和测试集,利用训练集对构建的人像抠图神经网络模型进行训练,并利用测试集测试人像抠图神经网络模型的有效性,得到训练好的人像抠图神经网络模型;S5.将待抠图图像输入训练好的人像抠图神经网络模型,通过对待抠图图像的图像特征进行识别提取和融合,输出待抠图图像的透明度掩膜的预测结果;S6.根据待抠图图像的透明度掩膜的预测结果,从待抠图图像中抠取人像图像。2.根据权利要求1所述的基于混合标注数据的人像抠图方法,其特征在于,所述混合标注图像数据集包括对图像特征进行细节标注的精细标注图像子数据集、对图像特征进行粗略标注的粗标注图像子数据集和背景图像子数据集,所述精细标注图像子数据集和粗标注图像子数据集均包括前景人像图像和前景人像图像对应的透明度掩膜alphamatte,所述背景图像子数据集包括以自然景象为背景的背景图像。3.根据权利要求2所述的基于混合标注数据的人像抠图方法,其特征在于,对混合标注图像数据集进行预处理的具体过程为:S21.将前景人像图像、前景人像图像对应的alphamatte和随机的背景图像合成RGB图像,并将alphamatte通过膨胀腐蚀的操作生成alphamatte对应的trimap;S22.通过随机裁剪、随机翻转和统一图像大小对前景人像图像、alphamatte、背景图像、RGB图像和trimap进行数据增强。4.根据权利要求3所述的基于混合标注数据的人像抠图方法,其特征在于,所述人像抠图神经网络模型包括共享编码器、金字塔池化模块、Bridgeblock模块、语义解码器、细节解码器和特征融合模块,所述共享编码器的输出端分别连接金字塔池化模块的输入端和Bridgeblock模块的输入端,RGB图像输入共享编码器,共享编码器分别输出RGB图像的第一特征图至金字塔池化模块和Bridge block模块,所述金字塔池化模块的输入端连接语义解码器的输入端,金字塔池化模块提取第一特征图的全局上下文特征,输出第二特征图至语义解码器,语义解码器识别第二特征图整体的语义部分,输出第三特征图sematic map,Bridge block模块的输入端连接细节解码器的输入端,Bridge block模块获取第一特征图的细节信息和融合低层图像特征,输出第四特征图至细节解码器,细节解码器提取第四特征图的细节信息,输出第五特征图detail map,细节解码器和语义解码器的输出端均连接特征融合模块的输入端,特征融合模块将第三特征图sematic map和第五特征图detail map进行融合,输出RGB图像的预测alpha matte。5.根据权利要求4所述的基于混合标注数据的人像抠图方法,其特征在于,选取ResNet
‑
34网络作为主干网络的共享编码器由若干个依次连接的第一block组成,输入共享编码器的RGB图像每经过一个用于提取第二特征图特征的第一blo...
【专利技术属性】
技术研发人员:杨志景,柏安辉,陈添水,施煜锴,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。