一种基于生成对抗网络的像素级人像抠图方法技术

技术编号：17781123 阅读：58 留言：0更新日期：2018-04-22 10:25

本发明专利技术公开了一种基于生成对抗网络的像素级人像抠图方法，解决了机器抠图领域需要海量制作成本巨大的数据集训练优化网络的问题。本发明专利技术预先设置对抗学习模式的生成网络和判别网络，生成网络为具有跳跃连接的深度神经网络；将含有人像的真实图像输入生成网络输出人景分割图像；将第一和第二图像对分别输入到判别网络输出判别概率，确定生成网络和判别网络的损失函数；根据最小化两个网络损失函数值调整两个网络的配置参数，完成生成网络的训练；测试图像输入到训练完成后的生成网络以生成人景分割图像，将生成图像概率化，最后将概率矩阵送入条件随机场进一步优化。本发明专利技术批量性地减少了训练用图数量，提高了效率和分割精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于生成对抗网络的像素级人像抠图方法
本专利技术涉及计算机视觉
，尤其涉及像素级人像抠图方法，具体是一种基于生成对抗网络的像素级人像抠图方法，用于人像与背景分离。
技术介绍
人像抠图一直是计算机视觉领域的一个热点问题。像素级人像抠图要求精确地将一个对象的前景从背景中提取出来，属于更为精细的二分类语义分割问题。随着电子商务的飞速发展，人像抠图有非常广阔的应用场景，比如越来越多的人选择在网络上购买服装，于是电商的以图搜物功能应运而生。准确的搜索到相似的服装是一件很困难的事情，所以有必要将图片中的人像分割出来。又如随着各种人像美化软件的兴起，其中的背景虚化功能也需要将人像与背景精准地区分。又比如在破案监控中，将监控得到的人像进行预处理，以便快速定位搜索目标。但是在大多数图像中，背景比较复杂，前景与背景精确区分技术还有待提高。在深度学习时代之前，人们解决相关语义分割问题主要是使用基于像素的聚类方法和基于“图划分”(GraphPartitioning)算法，传统基于图划分的语义分割方法都是将图像抽象为图(Graph)的形式，然后借助图理论中的算法进行图像的语义分割，此方法的主要缺点是如果背景比较复杂或者背景和目标相似度很大，分割效果不好，且速度很慢。随着人工智能2.0时代的到来，深度学习技术的发展，计算机能力的提升，以及大数据的产生，为语义分割技术的发展奠定了良好环境。目前已经有很多基于深度神经网络的模型用于语义分割，例如全卷积网络(FCN)，通过使用上采样的反卷积层，得到端到端的密集预测。但因为其因网络结构简单，往往需要很多训练集图像来训练网络。除此之外...
一种基于生成对抗网络的像素级人像抠图方法

【技术保护点】
一种基于生成对抗网络的像素级人像抠图方法，针对含有人像的真实图像，通过人工标注的方式得到真实人像与背景分离的标注图像，其特征在于，包括有如下步骤：(1)预设网络：预先设置生成网络以及判别网络，将两个网络设置为对抗学习模式，所述生成网络以及判别网络的类型均为深度神经网络，其中，生成网络的深度神经网络为具有跳跃连接的深度神经网络，也简称为生成网络；(2)生成分割图像：将含有人像的真实图像输入生成网络，输出人像与背景分离的分割图像，简称生成人景分割图像；(3)计算损失函数值：将含有人像的真实图像和生成网络输出的生成人景分割图像作为第一图像对，含有人像的真实图像与标注图像作为第二图像对,分别输入判别网络，通过判别网络计算出假判别概率和真判别概率，利用判别网络的损失函数公式和生成网络的损失函数公式，得到判别网络的损失函数值和生成网络的损失函数值；(4)更新网络参数：分别最小化判别网络的损失函数值和生成网络的损失函数值，利用深度神经网络后向传播算法，迭代更新生成网络和判别网络的各参数取值，完成生成网络和判别网络的训练；(5)生成测试集人景分割图像：当生成网络训练完成后，完成训练后的生成网络接收待分...

【技术特征摘要】
1.一种基于生成对抗网络的像素级人像抠图方法，针对含有人像的真实图像，通过人工标注的方式得到真实人像与背景分离的标注图像，其特征在于，包括有如下步骤：(1)预设网络：预先设置生成网络以及判别网络，将两个网络设置为对抗学习模式，所述生成网络以及判别网络的类型均为深度神经网络，其中，生成网络的深度神经网络为具有跳跃连接的深度神经网络，也简称为生成网络；(2)生成分割图像：将含有人像的真实图像输入生成网络，输出人像与背景分离的分割图像，简称生成人景分割图像；(3)计算损失函数值：将含有人像的真实图像和生成网络输出的生成人景分割图像作为第一图像对，含有人像的真实图像与标注图像作为第二图像对,分别输入判别网络，通过判别网络计算出假判别概率和真判别概率，利用判别网络的损失函数公式和生成网络的损失函数公式，得到判别网络的损失函数值和生成网络的损失函数值；(4)更新网络参数：分别最小化判别网络的损失函数值和生成网络的损失函数值，利用深度神经网络后向传播算法，迭代更新生成网络和判别网络的各参数取值，完成生成网络和判别网络的训练；(5)生成测试集人景分割图像：当生成网络训练完成后，完成训练后的生成网络接收待分割的含有人像的真实图像，在该网络中通过迭代计算，输出测试图像的生成人景分割图像；(6)优化分割图像，完成人像抠图：将测试图像的生成人景分割图像概率化，得到测试图像的生成人景分割图像的人像概率矩阵和背景概率矩阵，将人像概率矩阵和背景概率矩阵作为条件随机场的输入，使用条件随机场对概率化后的测试图像的生成人景分割图像进行进一步细化，得到更加精确的人像与背景分离的图像，完成基于生成对抗网络的像素级人像抠图。2.如权利要求1所述的基于生成对抗网络的像素级人像抠图方法，其特征在于，步骤1中所述的具有跳跃连接的深度神经网络是用于构成生成网络的N个串接的编码器层与N个串接的解码器层之间的跳跃连接的梯度传递通路。3.如权利要求2所述的基于生成对抗网络的像素级人像抠图方法，其特征在于，所述生成网络的解码器层中引入了随机失活机制，具体是在生成网络的每个解码器层最终输出之前随机抛掉失活参数。4.如权利要求1所述的基于生成对抗网络的像素级人像抠图方法，其特征在于，在步骤(3)和步骤(4)中提及的损失函数，其中，生成网络的损失函数越小，生成网络所输出的人像与背景分离的分割图像真实度越高，生成网络损失函数公式由两个损失通过两个系数进行加权得到...

【专利技术属性】
技术研发人员：王伟，周红丽，王晨吉，方凌，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人