人体分割神经网络的训练方法及设备技术

技术编号：22240107 阅读：12 留言：0更新日期：2019-10-09 19:47

本公开实施例提供人体分割神经网络的训练方法及设备，该方法包括：将第一训练图像进行标注处理，其中人体分割区域的像素值标注为1，背景区域的像素值标注为0；将标注后的第一训练图像的像素值乘以255，得到像素值为0和255的第二训练图像，并对第二训练图像的像素值进行插值，得到像素值为0至255的第三训练图像；将第三训练图像的像素值分别除以255，得到像素值为0至1的掩膜，将所述像素值为0至1的掩膜按照预设值进行截断，得到像素值为0和1的掩膜；将截断后像素值为0和1的掩膜作为结果数据输入至预设的神经网络训练，本公开实施例训练好的预设的神经网络对图像中的人体区域进行分割时，得到的人体分割图像的边缘更平滑。

Training Method and Equipment of Human Segmentation Neural Network

全部详细技术资料下载

【技术实现步骤摘要】
人体分割神经网络的训练方法及设备
本公开实施例涉及计算机
，尤其涉及一种人体分割神经网络的训练方法及设备。
技术介绍
在小视频制作过程中，为了满足客户个性化需求，视频软件通常提供图像融合功能：即将图像中的人体区域分割出来，再将原始背景区域删除，替换为有特效效果的背景，以提升视频的美化效果。目前，对人体图像进行分割主要是通过深度学习神经网络实现的，其处理过程主要为：将目标图像下采样至与深度学习神经网络输入尺寸对应的大小，然后通过深度学习神经网络对图像中人体区域进行识别，将人体区域从背景中分割出来，然后通过上采样与原图像进行融合。现有的对深度学习神经网络进行训练过程需要使用mask(掩膜)，而现有的神经网络中使用的mask(掩膜)只有0和1的值，且其中1表示人体分割区域，0表示背景区域，通过这样的mask(掩膜)训练出来的深度学习神经网络在对图像中的人体区域进行分割时，得到的人体分割图像的边缘通常会不平滑，而且上采样后图像的边缘锯齿会变得很明显，图像边缘出现边缘锯齿现象，影响人体分割后图像的显示效果。
技术实现思路
本公开实施例提供一种人体分割神经网络的训练方法及设备，以克服通过现有掩膜训练出来的深度学习神经网络在对图像中的人体区域进行分割时，得到的人体分割图像的边缘不平滑的问题。第一方面，本公开实施例提供一种人体分割神经网络的训练方法，包括：将第一训练图像进行标注处理，其中第一训练图像中的人体分割区域的像素值标注为1，背景区域的像素值标注为0；将标注后的第一训练图像的像素值乘以255，得到第二训练图像，其中所述第二训练图像中的人体分割区域的像素值为255，...

【技术保护点】
1.一种人体分割神经网络的训练方法，其特征在于，包括：将第一训练图像进行标注处理，其中第一训练图像中的人体分割区域的像素值标注为1，背景区域的像素值标注为0；将标注后的第一训练图像的像素值乘以255，得到第二训练图像，其中所述第二训练图像中的人体分割区域的像素值为255，背景区域的像素值为0；对所述第二训练图像的像素值进行插值，得到像素值为0至255的第三训练图像；将所述第三训练图像的像素值分别除以255，得到像素值为0至1的掩膜；将所述像素值为0至1的掩膜按照预设值进行截断，得到截断后像素值为0和1的掩膜，将所述截断后像素值为0和1的掩膜作为结果数据输入至预设的神经网络进行训练。

【技术特征摘要】
1.一种人体分割神经网络的训练方法，其特征在于，包括：将第一训练图像进行标注处理，其中第一训练图像中的人体分割区域的像素值标注为1，背景区域的像素值标注为0；将标注后的第一训练图像的像素值乘以255，得到第二训练图像，其中所述第二训练图像中的人体分割区域的像素值为255，背景区域的像素值为0；对所述第二训练图像的像素值进行插值，得到像素值为0至255的第三训练图像；将所述第三训练图像的像素值分别除以255，得到像素值为0至1的掩膜；将所述像素值为0至1的掩膜按照预设值进行截断，得到截断后像素值为0和1的掩膜，将所述截断后像素值为0和1的掩膜作为结果数据输入至预设的神经网络进行训练。2.根据权利要求1所述的方法，其特征在于，所述对所述第二训练图像像素值进行插值，得到像素值为0至255的第三训练图像，包括：若所述第二训练图像的尺寸大于预设的神经网络的输入尺寸，则对所述第二训练图像进行抗锯齿法下采样处理，得到尺寸为预设的神经网络的输入尺寸、像素值为0至255的第三训练图像；若所述第二训练图像的尺寸小于预设的神经网络的输入尺寸，则对所述第二训练图像进行双三次差值上采样处理，得到尺寸为预设的神经网络的输入尺寸、像素值为0至255的第三训练图像；若所述第二训练图像的尺寸等于预设的神经网络的输入尺寸，则对对所述第二训练图像进行双三次差值处理，得到像素值为0至255的第三训练图像。3.根据权利要求1所述的方法，其特征在于，所述将所述像素值为0至1的掩膜按照预设值进行截断，得到截断后像素值为0和1的掩膜，包括：若所述像素值为0至1的掩膜的像素值大于所述预设值，则截断后的掩膜像素值取值为1；若若所述像素值为0至1的掩膜的像素值小于或等于所述预设值，则截断后的掩膜像素值取值为0。4.根据权利要求2所述的方法，其特征在于，所述抗锯齿法下采样为最近邻插值法下采样。5.根据权利要求4所述的方法，其特征在于，所述预设值为0.5。6.一种人体分割神经网络的训练设备，其特征在于，包括：第一图像标注模块，用于将第一训练图像进行标注处理，其中第一训练图像中的...

【专利技术属性】
技术研发人员：李华夏，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人