The embodiment of the present invention provides a model training method, device, system and storage medium. Network training methods include: acquiring training images and training image masks; input training images into the front-end model structure of the case segmentation model to obtain the alignment feature map of the target area, where the alignment feature map of the target area is relative to the first target area used to indicate the location of the target object in the training image. Corresponding and aligned feature maps; input the aligned feature map of the target area into the mask generator of the instance segmentation model to obtain the generated segmentation mask corresponding to the aligned feature map of the target area; determine the true segmentation mask corresponding to the aligned feature map of the target area based on the training image mask; and utilize the target area. Domain alignment feature map, generation of segmentation mask and real segmentation mask are used to train the mask generator and discriminator. The method mentioned above can effectively solve the problem that the mask generator is affected by the multi-peak property of the image.
【技术实现步骤摘要】
模型训练与实例分割方法、装置和系统及存储介质
本专利技术涉及图像识别领域,更具体地涉及一种模型训练方法、装置和系统以及一种实例分割方法、装置和系统以及存储介质。
技术介绍
实例分割一直是计算机视觉领域十分重要且备受关注的问题与技术方法,其目标是给定一张图像,通过算法给出图像中所有目标对象的分割遮罩(SegmentationMask)和类别信息。当下实例分割的主流框架是遮罩区域卷积神经网络(Mask-RCNN)框架。在Mask-RCNN中,先通过区域提议网络(RPN)对每一张图像给出若干目标区域(简称RoI,也可以称为感兴趣区域),再对RoI进行RoI对齐得到RoI对齐特征图,最后可以将RoI对齐特征图输入遮罩生成器得到分割遮罩。当下遮罩生成器的训练方法无法很好处理图像的多峰问题,即当某个RoI中含有多个物体时,模型输出的分割遮罩无法与其中任何一个物体较好匹配。
技术实现思路
考虑到上述问题而提出了本专利技术。本专利技术提供了一种模型训练方法、装置和系统以及一种实例分割方法、装置和系统以及存储介质。根据本专利技术一方面,提供了一种模型训练方法。该方法包括:获取训练图像和训练图像遮罩;将训练图像输入实例分割模型中的前端模型结构,以获得目标区域对齐特征图,其中,目标区域对齐特征图为与用于指示训练图像中的目标对象所在位置的第一目标区域相对应的、经对齐操作的特征图;将目标区域对齐特征图输入实例分割模型中的遮罩生成器,以获得与目标区域对齐特征图对应的生成分割遮罩;基于训练图像遮罩确定与目标区域对齐特征图对应的真实分割遮罩;以及利用目标区域对齐特征图、生成分割遮罩和真实分割 ...
【技术保护点】
1.一种模型训练方法,包括:获取训练图像和训练图像遮罩;将所述训练图像输入实例分割模型中的前端模型结构,以获得目标区域对齐特征图,其中,所述目标区域对齐特征图为与用于指示所述训练图像中的目标对象所在位置的第一目标区域相对应的、经对齐操作的特征图;将所述目标区域对齐特征图输入所述实例分割模型中的遮罩生成器,以获得与所述目标区域对齐特征图对应的生成分割遮罩;基于所述训练图像遮罩确定与所述目标区域对齐特征图对应的真实分割遮罩;以及利用所述目标区域对齐特征图、所述生成分割遮罩和所述真实分割遮罩对所述遮罩生成器和判别器进行对抗训练。
【技术特征摘要】
1.一种模型训练方法,包括:获取训练图像和训练图像遮罩;将所述训练图像输入实例分割模型中的前端模型结构,以获得目标区域对齐特征图,其中,所述目标区域对齐特征图为与用于指示所述训练图像中的目标对象所在位置的第一目标区域相对应的、经对齐操作的特征图;将所述目标区域对齐特征图输入所述实例分割模型中的遮罩生成器,以获得与所述目标区域对齐特征图对应的生成分割遮罩;基于所述训练图像遮罩确定与所述目标区域对齐特征图对应的真实分割遮罩;以及利用所述目标区域对齐特征图、所述生成分割遮罩和所述真实分割遮罩对所述遮罩生成器和判别器进行对抗训练。2.如权利要求1所述的方法,其中,所述利用所述目标区域对齐特征图、所述生成分割遮罩和所述真实分割遮罩对所述遮罩生成器和判别器进行对抗训练包括:将所述目标区域对齐特征图和所述生成分割遮罩作为生成数据对,将所述目标区域对齐特征图和所述真实分割遮罩作为真实数据对,将所述生成数据对和所述真实数据对输入所述判别器,以获得判别结果;基于所述判别结果计算生成器损失和判别器损失;以及根据所述生成器损失和所述判别器损失优化所述遮罩生成器和所述判别器,以获得经训练的所述遮罩生成器。3.如权利要求2所述的方法,其中,所述前端模型结构包括区域提议网络,用于输出用于指示所述训练图像中的目标对象所在位置的第二目标区域的目标区域信息,所述第一目标区域基于所述第二目标区域过滤获得,所述实例分割模型还包括包围框回归器和分类器,所述方法还包括:将所述目标区域对齐特征图输入所述包围框回归器,以获得与所述目标区域对齐特征图相对应的、用于指示所述训练图像中的目标对象所在位置的包围框的包围框信息;将所述目标区域对齐特征图输入所述分类器,以获得所述目标区域对齐特征图所对应的包围框中所包含对象的对象分类信息;获取所述训练图像中的目标对象的标注位置信息和标注分类信息;基于所述标注位置信息和所述目标区域信息计算所述区域提议网络的区域提议网络回归损失;基于所述标注位置信息和所述包围框信息计算所述包围框回归器的包围框回归器损失;基于所述标注分类信息和所述对象分类信息计算所述分类器的分类器损失;所述根据所述生成器损失和所述判别器损失优化所述遮罩生成器和所述判别器,以获得经训练的所述遮罩生成器包括:交替优化所述实例分割模型和所述判别器以最小化模型损失和所述判别器损失直至收敛,以获得经训练的所述实例分割模型,其中,所述经训练的所述实例分割模型包括所述经训练的所述遮罩生成器,所述模型损失包括所述生成器损失、所述区域提议网络回归损失、所述包围框回归器损失和所述分类器损失。4.如权利要求1所述的方法,其中,所述将所述目标区域对齐特征图输入所述实例分割模型中的遮罩生成器,以获得与所述目标区域对齐特征图对应的生成分割遮罩包括:将所述目标区域对齐特征图和第一预定噪声输入所述遮罩生成器,以获得所述生成分割遮罩。5.如权利要求4所述的方法,其中,在所述将所述目标区域对齐特征图和第一预定噪声输入所述遮罩生成器,以获得所述生成分割遮罩之前,所述方法还包括:从预定义均匀分布中随机抽样,以获得所述第一预定噪声。6.如权利要求1所述的方法,其中,所述基于所述训练图像遮罩确定与所述目标区域对齐特征图对应的真实分割遮罩包括:基于所述目标区域对齐特征图所对应的第一目标区域的位置对所述训练图像遮罩进行裁剪和/或缩放,以获得所述真实分割遮罩。7.如权利要求1至6任一项所述的方法,其中,所述实例分割模型为遮罩区域卷积神经网络,所述前端模型结构依次包括卷积神经网络、区域提议网络和目标区域对齐模型,所述目标区域对齐特征图由所述目标区域对齐模型输出。8.如权利要求1至6任一项所述的方法,其中,所述实例分割模型为遮罩区域卷积神经网络,所述前端模型结构依次包括卷积神经网络、区域提议网络和目标区域对齐模型,所述目标区域对齐特征图由所述目标区域对齐模型输出,所述遮罩区域卷积神经网络还包括在所述目标区域对齐模型之后连接的包围框回归器,所述方法还包括:获取至少...
【专利技术属性】
技术研发人员:程大治,张祥雨,
申请(专利权)人:北京旷视科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。