图像分割方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:21954701 阅读:14 留言:0更新日期:2019-08-24 18:40
本申请涉及一种图像分割方法、装置、计算机设备和存储介质,图像分割方法中的神经网络模型不包含传统的图像分割模型中的目标检测网络,其建立预分割的图像中不同对象与神经网络模型输出特征图的通道的对应关系,基于该对应关系可以在输入图像后直接得到包含预设数量个通道的特征图,该特征图的各个通道分别对应输入图像中不同的目标对象,在此基础上,再基于特征图的各个通道分割图像得到分割结果。因此,该方法简化了实例分割模型的网络结构,实例分割效率高。

Image Segmentation Method, Device, Computer Equipment and Storage Media

【技术实现步骤摘要】
图像分割方法、装置、计算机设备和存储介质
本申请涉及计算机视觉
,特别是涉及一种图像分割方法、装置、计算机设备和存储介质。
技术介绍
随着深度学习的发展和智能终端的普及,图像分割的应用越来约广泛。例如,快速而准确的多人人像分割是现阶段具有需求的技术之一。多人人像分割是实例分割的一种,现有实例分割方法大多面向多类别分割问题,其流程均包含了包括检测在内的多个操作,较为复杂。以近年来应用最为广泛的MaskR-CNN算法为例,其模型包括卷积网络、Regionproposalnetwork、ROIAlign以及检测分类、检测框回归、分割等网络层。其缺陷表现为:模型网络复杂、使用占据资源多;在卷积外还使用了多种自定义的操作,难以在多种不同平台中实现与优化;将检测框区域的特征采样到同一较小尺寸后得到对应分割结果,分割边缘的精确度较低。此外,尽管在一些针对人像分割的方法中提出了“自底向上”的分割流程,如Richeimer,BoundingBoxEmbeddingforSingleShotPersonInstanceSegmentation,arXivpreprintarXiv:1807.07674(2018),但是,此类图像分割方法仍包含人体检测或关键点检测等操作,其实施具有较高的模型复杂度,难以适用于实际需求。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够快速准确的实现的图像分割的方法、装置、计算机设备和存储介质。第一方面,本申请提出了一种图像分割方法,所述方法包括:将包含至少一个目标对象的图像输入训练好的神经网络模型,获得具有预设数量个通道的特征图,其中,所述预设数量大于等于图像中目标对象的最大可能数量,所述特征图的每个通道对应不同的至多一个目标对象,对于对应了一个第一目标对象的特征图通道,该特征图通道中有与所述第一目标对象对应的第一区域,所述第一区域与所述第一目标对象在所述图像中的所占区域相对应;所述第一目标对象为所述图像中的任一目标对象;根据所述特征图的通道得到所述图像的分割结果。在其中一个实施例中,所述方法还包括:获取包含至少一个目标对象的训练图像;对所述训练图像中的各个目标对象所占的区域分别进行标注,根据标注的训练图像生成标注特征图,所述标注特征图具有预设数量个通道,标注特征图的每个通道对应不同的至多一个目标对象,对于对应了一个第二目标对象的标注特征图通道,该标注特征图通道中有与所述第二目标对象对应的第二区域,所述第二区域与所述第二目标对象在所述训练图像中的所占区域相对应;所述第二目标对象为所述训练图像中的任一目标对象;采用所述训练图像和标注特征图对神经网络模型进行训练,得到训练好的神经网络模型。在其中一个实施例中,所述采用所述训练图像和标注特征图对神经网络模型进行训练,得到训练好的神经网络模型,包括:将所述训练图像输入神经网络模型,获得训练特征图;根据训练特征图和标注特征图,计算神经网络模型的损失函数值;基于所述损失函数值对所述神经网络模型的参数进行更新,得到训练好的神经网络模型。在其中一个实施例中,所述对所述训练图像中的各个目标对象分别所占的区域进行标注,根据标注的训练图像生成得到标注特征图,包括:对所述训练图像中的各个目标对象所占的区域分别进行标注,根据标注的训练图像中各个目标对象所占区域的位置对所述训练图像中的各个目标对象编号,目标对象和与其具有相同编号的所述标注特征图的通道对应,对于对应了一个第二目标对象的标注特征图通道,将该标注特征图的通道中坐标与第二目标对象在所述训练图像中所占区域的坐标相对应的区域作为第二区域,令所述第二区域像素值为第一预设值,该标注特征图通道中除第二区域以外的其他区域的像素值为第二预设值,从而得到标注特征图。在其中一个实施例中,根据各个目标对象在所述训练图像中所占区域的位置对所述训练图像中的各个目标对象编号,包括:构建坐标系,以训练图像的长和宽中基本与目标对象矗立方向垂直的方向为坐标轴;获取所述训练图像中每一目标对象对应的坐标;按照所述训练图像中每一目标对象对应的坐标数值大小对所述训练图像中每一目标对象顺序编号。在其中一个实施例中,若所述图像为自拍图像,则所述特征图的通道的预设数量不大于4。在其中一个实施例中,所述特征图的每个通道与所述图像尺寸相同,所述第一区域与第一目标对象在所述图像中所占区域的位置对应且所占面积相同。在其中一个实施例中,根据所述特征图的通道得到所述图像的分割结果,包括:根据所述特征图的各个通道的二值化图像分割所述图像,得到所述图像的分割结果。在其中一个实施例中,所述神经网络模型包含柔性最大层softmax,所述softmax层用于计算输入所述softmax层的特征向量属于某一的目标对象的概率,所述特征向量属于某一的目标对象的概率被用于确定所述特征图中各位置的像素值。在其中一个实施例中,所述神经网络模型为全卷积神经网络模型,神经网络模型包含多个卷积层,神经网络模型的最后一个卷积层的通道数量和特征图的通道的预设数量相同。第二方面,本申请提出了一种图像分割装置,所述装置包括:图像分析模块,将包含至少一个目标对象的图像输入训练好的神经网络模型,获得具有预设数量个通道的特征图,其中,所述预设数量大于等于图像中目标对象的最大可能数量,所述特征图的每个通道对应不同的至多一个目标对象,对于对应了一个第一目标对象的特征图通道,该特征图通道中有与所述第一目标对象对应的第一区域,所述第一区域与所述第一目标对象在所述图像中的所占区域相对应;所述第一目标对象为所述图像中的任一目标对象;分割执行模块,根据所述特征图的通道得到所述图像的分割结果。第三方面,本申请提出了一种计算机设备,包括存储器及处理器,所述存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请任一实施例中的方法的步骤。第四方面,本申请提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请任一实施例中的方法的步骤。上述图像分割方法、装置、计算机设备和存储介质,利用预先标注的多目标对象图像数据来训练神经网络模型,将具有多个目标对象的图像输入训练好的神经网络模型后直接得到包含预设数量个通道的特征图,该特征图的各个通道分别对应输入图像中不同的目标对象,在此基础上,再基于特征图的各个通道分割图像得到分割结果。该方法所使用的神经网络模型不包含传统的图像分割模型中的目标检测网络,简化了图像分割模型的网络结构,降低了算力需求,提高了图像分割效率,具有模型参数少、运行速度快、结构简单、利于实现、需要训练数据与标注较少、分割边缘清晰的特点,可应用于手机等有图像分割需求的移动设备中。附图说明图1为一个实施例中图像分割方法的应用环境图;图2为一个实施例中图像分割方法的流程示意图;图3为一个实施例中步骤201的细化步骤的流程示意图;图4为一个实施例中步骤205的细化步骤的流程示意图;图5为一个实施例中标注的训练图像;图6为一个实施例中包含通道编号的标注的训练图像;图7为一个实施例中图像分割装置的结构框图;图8为一个实施例中计算机设备的内部结构图;图9为一个实施例中图像分割结果。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附本文档来自技高网...

【技术保护点】
1.一种图像分割方法,其特征在于,所述方法包括:将包含至少一个目标对象的图像输入训练好的神经网络模型,获得具有预设数量个通道的特征图,其中,所述预设数量大于等于图像中目标对象的最大可能数量,所述特征图的每个通道对应不同的至多一个目标对象,对于对应了一个第一目标对象的特征图通道,该特征图通道中有与所述第一目标对象对应的第一区域,所述第一区域与所述第一目标对象在所述图像中的所占区域相对应;所述第一目标对象为所述图像中的任一目标对象;根据所述特征图的通道得到所述图像的分割结果。

【技术特征摘要】
1.一种图像分割方法,其特征在于,所述方法包括:将包含至少一个目标对象的图像输入训练好的神经网络模型,获得具有预设数量个通道的特征图,其中,所述预设数量大于等于图像中目标对象的最大可能数量,所述特征图的每个通道对应不同的至多一个目标对象,对于对应了一个第一目标对象的特征图通道,该特征图通道中有与所述第一目标对象对应的第一区域,所述第一区域与所述第一目标对象在所述图像中的所占区域相对应;所述第一目标对象为所述图像中的任一目标对象;根据所述特征图的通道得到所述图像的分割结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取包含至少一个目标对象的训练图像;对所述训练图像中的各个目标对象所占的区域分别进行标注,根据标注的训练图像生成标注特征图,所述标注特征图具有预设数量个通道,标注特征图的每个通道对应不同的至多一个目标对象,对于对应了一个第二目标对象的标注特征图通道,该标注特征图通道中有与所述第二目标对象对应的第二区域,所述第二区域与所述第二目标对象在所述训练图像中的所占区域相对应;所述第二目标对象为所述训练图像中的任一目标对象;采用所述训练图像和标注特征图对神经网络模型进行训练,得到训练好的神经网络模型。3.根据权利要求2所述的方法,其特征在于,所述采用所述训练图像和标注特征图对神经网络模型进行训练,得到训练好的神经网络模型,包括:将所述训练图像输入神经网络模型,获得训练特征图;根据训练特征图和标注特征图,计算神经网络模型的损失函数值;基于所述损失函数值对所述神经网络模型的参数进行更新,得到训练好的神经网络模型。4.根据权利要求2所述的方法,其特征在于,所述对所述训练图像中的各个目标对象分别所占的区域进行标注,根据标注的训练图像生成得到标注特征图,包括:对所述训练图像中的各个目标对象所占的区域分别进行标注,根据标注的训练图像中各个目标对象所占区域的位置对所述训练图像中的各个目标对象编号,目标对象和与其具有相同编号的所述标注特征图的通道对应,对于对应了一个第二目标对象的标注特征图通道,将该标注特征图的通道中坐标与第二目标对象在所述训练图像中所占区域的坐标相对应的区域作为第二区域,令所述第二区域像素值为第一预设值,该标注特征图通道中除第二区域以外的其他区域的像素值为第二预设值,从而得到标注特征图。5.根据权利要求4所述的方法,其特征在于,根据...

【专利技术属性】
技术研发人员:王培森熊鹏飞
申请(专利权)人:北京迈格威科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1