人体分割神经网络的训练方法及设备技术

技术编号:22240107 阅读:12 留言:0更新日期:2019-10-09 19:47
本公开实施例提供人体分割神经网络的训练方法及设备,该方法包括:将第一训练图像进行标注处理,其中人体分割区域的像素值标注为1,背景区域的像素值标注为0;将标注后的第一训练图像的像素值乘以255,得到像素值为0和255的第二训练图像,并对第二训练图像的像素值进行插值,得到像素值为0至255的第三训练图像;将第三训练图像的像素值分别除以255,得到像素值为0至1的掩膜,将所述像素值为0至1的掩膜按照预设值进行截断,得到像素值为0和1的掩膜;将截断后像素值为0和1的掩膜作为结果数据输入至预设的神经网络训练,本公开实施例训练好的预设的神经网络对图像中的人体区域进行分割时,得到的人体分割图像的边缘更平滑。

Training Method and Equipment of Human Segmentation Neural Network

【技术实现步骤摘要】
人体分割神经网络的训练方法及设备
本公开实施例涉及计算机
,尤其涉及一种人体分割神经网络的训练方法及设备。
技术介绍
在小视频制作过程中,为了满足客户个性化需求,视频软件通常提供图像融合功能:即将图像中的人体区域分割出来,再将原始背景区域删除,替换为有特效效果的背景,以提升视频的美化效果。目前,对人体图像进行分割主要是通过深度学习神经网络实现的,其处理过程主要为:将目标图像下采样至与深度学习神经网络输入尺寸对应的大小,然后通过深度学习神经网络对图像中人体区域进行识别,将人体区域从背景中分割出来,然后通过上采样与原图像进行融合。现有的对深度学习神经网络进行训练过程需要使用mask(掩膜),而现有的神经网络中使用的mask(掩膜)只有0和1的值,且其中1表示人体分割区域,0表示背景区域,通过这样的mask(掩膜)训练出来的深度学习神经网络在对图像中的人体区域进行分割时,得到的人体分割图像的边缘通常会不平滑,而且上采样后图像的边缘锯齿会变得很明显,图像边缘出现边缘锯齿现象,影响人体分割后图像的显示效果。
技术实现思路
本公开实施例提供一种人体分割神经网络的训练方法及设备,以克服通过现有掩膜训练出来的深度学习神经网络在对图像中的人体区域进行分割时,得到的人体分割图像的边缘不平滑的问题。第一方面,本公开实施例提供一种人体分割神经网络的训练方法,包括:将第一训练图像进行标注处理,其中第一训练图像中的人体分割区域的像素值标注为1,背景区域的像素值标注为0;将标注后的第一训练图像的像素值乘以255,得到第二训练图像,其中所述第二训练图像中的人体分割区域的像素值为255,背景区域的像素值为0;对所述第二训练图像的像素值进行插值,得到像素值为0至255的第三训练图像;将所述第三训练图像的像素值分别除以255,得到像素值为0至1的掩膜;将所述像素值为0至1的掩膜按照预设值进行截断,得到截断后像素值为0和1的掩膜,将所述截断后像素值为0和1的掩膜作为结果数据输入至预设的神经网络进行训练。第二方面,本公开实施例提供一种人体分割神经网络的训练设备,包括:第一图像标注模块,用于将第一训练图像进行标注处理,其中第一训练图像中的人体分割区域的像素值标注为1,背景区域的像素值标注为0;第二图像获取模块,用于将标注后的第一训练图像的像素值乘以255,得到第二训练图像,其中所述第二训练图像中人体分割区域的像素值为255,背景区域的像素值为0;第三图像获取模块,用于对所述第二训练图像的像素值进行插值,得到像素值为0至255的第三训练图像;掩膜获取模块,用于将所述第三训练图像的像素值分别除以255,得到像素值为0至1的掩膜;掩膜截断模块,用于将所述像素值为0至1的掩膜按照预设值进行截断,得到截断后像素值为0和1的掩膜,将所述截断后像素值为0和1的掩膜作为结果数据输入至预设的神经网络进行训练。第三方面,本公开实施例提供一种电子设备,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的人体分割神经网络的训练方法。第四方面,本公开实施例提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的人体分割神经网络的训练方法。本实施例提供的人体分割神经网络的训练方法及设备,该方法首先将第一训练图像进行标注处理,其中人体分割区域的像素值标注为1,背景区域的像素值标注为0;然后将标注后的第一训练图像的像素值乘以255,得到像素值为0和255的第二训练图像,并对第二训练图像的像素值进行插值,得到像素值为0至255的第三训练图像;再将第三训练图像的像素值分别除以255,得到像素值为0至1的掩膜,将所述像素值为0至1的掩膜按照预设值进行截断,得到截断后像素值为0和1的掩膜;最后将截断后像素值为0和1的掩膜作为结果数据输入至预设的神经网络进行训练,本公开实施例训练好的预设的神经网络对图像中的人体区域进行分割时,得到的人体分割图像的边缘更平滑,经过上采样后人体分割图像的边缘锯齿现象不明显,显示效果较佳。附图说明为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的人体分割神经网络的训练方法的系统架构示意图;图2为本公开实施例提供的人体分割神经网络的训练方法流程示意图一;图3为本公开实施例提供的人体分割神经网络的训练方法流程示意图二;图4为本公开实施例提供的人体分割神经网络的训练设备的结构框图;图5为本公开实施例提供的电子设备的结构示意图。具体实施方式为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。参考图1,图1为本专利技术实施例提供的人体分割神经网络的训练方法的系统架构示意图。如图1所示,本实施例提供的系统包括终端设备101和服务器102。其中,终端设备101可以为儿童故事机、手机、平板、车载终端等。本实施例对终端设备101的实现方式不做特别限制,只要该终端设备101能够对图像进行处理即可。服务器102可以是一台,也可以是多台服务器组成的集群。参考图2,图2为本公开实施例提供的人体分割神经网络的训练方法流程示意图一。本实施例的方法可以应用在终端设备或服务器中,该人体分割神经网络的训练方法包括:S201:将第一训练图像进行标注处理,其中第一训练图像中的人体分割区域的像素值标注为1,背景区域的像素值标注为0。在本公开实施例中,第一训练图像包含人体分割区域和背景区域。具体地,可以通过打标签的方式对第一训练图像进行标注处理。其中,第一训练图像可以来自不同类型的设备采集的图像,不同类型的设备采集采集的第一训练图像的尺寸可能尺寸也不同。S202:将标注后的第一训练图像的像素值乘以255,得到第二训练图像,其中所述第二训练图像中人体分割区域的像素值为255,背景区域的像素值为0。在本公开实施例中,通过将标注后的第一训练图像的像素值乘以255,将标注后的第一训练图像转化为RGB像素表示的第二训练图像。其中,第二训练图像也包含人体分割区域和背景区域。S203:对所述第二训练图像的像素值进行插值,得到像素值为0至255的第三训练图像。在本公开实施例中,通过插值处理将第二训练图像的像素值由0和255的值,转化为像素值为0至255的第三训练图像。其中,插值可以包括最近邻插值、双线性插值和双三次插值中的一种或多种。S204:将所述第三训练图像的像素值分别除以255,得到像素值为0至1的掩膜。在本公开实施例中,将像素值为0至255的第三训练图像除以255,的像素值为0至1的掩本文档来自技高网...

【技术保护点】
1.一种人体分割神经网络的训练方法,其特征在于,包括:将第一训练图像进行标注处理,其中第一训练图像中的人体分割区域的像素值标注为1,背景区域的像素值标注为0;将标注后的第一训练图像的像素值乘以255,得到第二训练图像,其中所述第二训练图像中的人体分割区域的像素值为255,背景区域的像素值为0;对所述第二训练图像的像素值进行插值,得到像素值为0至255的第三训练图像;将所述第三训练图像的像素值分别除以255,得到像素值为0至1的掩膜;将所述像素值为0至1的掩膜按照预设值进行截断,得到截断后像素值为0和1的掩膜,将所述截断后像素值为0和1的掩膜作为结果数据输入至预设的神经网络进行训练。

【技术特征摘要】
1.一种人体分割神经网络的训练方法,其特征在于,包括:将第一训练图像进行标注处理,其中第一训练图像中的人体分割区域的像素值标注为1,背景区域的像素值标注为0;将标注后的第一训练图像的像素值乘以255,得到第二训练图像,其中所述第二训练图像中的人体分割区域的像素值为255,背景区域的像素值为0;对所述第二训练图像的像素值进行插值,得到像素值为0至255的第三训练图像;将所述第三训练图像的像素值分别除以255,得到像素值为0至1的掩膜;将所述像素值为0至1的掩膜按照预设值进行截断,得到截断后像素值为0和1的掩膜,将所述截断后像素值为0和1的掩膜作为结果数据输入至预设的神经网络进行训练。2.根据权利要求1所述的方法,其特征在于,所述对所述第二训练图像像素值进行插值,得到像素值为0至255的第三训练图像,包括:若所述第二训练图像的尺寸大于预设的神经网络的输入尺寸,则对所述第二训练图像进行抗锯齿法下采样处理,得到尺寸为预设的神经网络的输入尺寸、像素值为0至255的第三训练图像;若所述第二训练图像的尺寸小于预设的神经网络的输入尺寸,则对所述第二训练图像进行双三次差值上采样处理,得到尺寸为预设的神经网络的输入尺寸、像素值为0至255的第三训练图像;若所述第二训练图像的尺寸等于预设的神经网络的输入尺寸,则对对所述第二训练图像进行双三次差值处理,得到像素值为0至255的第三训练图像。3.根据权利要求1所述的方法,其特征在于,所述将所述像素值为0至1的掩膜按照预设值进行截断,得到截断后像素值为0和1的掩膜,包括:若所述像素值为0至1的掩膜的像素值大于所述预设值,则截断后的掩膜像素值取值为1;若若所述像素值为0至1的掩膜的像素值小于或等于所述预设值,则截断后的掩膜像素值取值为0。4.根据权利要求2所述的方法,其特征在于,所述抗锯齿法下采样为最近邻插值法下采样。5.根据权利要求4所述的方法,其特征在于,所述预设值为0.5。6.一种人体分割神经网络的训练设备,其特征在于,包括:第一图像标注模块,用于将第一训练图像进行标注处理,其中第一训练图像中的...

【专利技术属性】
技术研发人员:李华夏
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1