基于一阶段目标检测框架的实例分割方法技术

技术编号：25044020 阅读：17 留言：0更新日期：2020-07-29 05:34

一种基于一阶段目标检测框架的实例分割方法，包括：1）对图像数据集标注进行编码，图像中的目标被定义为密集的点对象；2）构建实例分割网络模型，包括主干网络、主体特征提取模块、用于生成目标检测结果的检测模块和用于生成语义分割结果的分割模块四个部分；3）进行深度学习训练，主要体现为本发明专利技术所设计的一种适应实例分割任务的多任务损失函数；4）推断阶段，推断方法结合目标检测结果和语义分割结果，采用非极大值分割筛选方法，得出实例分割结果。本发明专利技术方法设计简单合理，不仅能保证原有目标检测框架的检测质量和检测速度，还能同时生成较高精度的分割掩膜，具备良好的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
基于一阶段目标检测框架的实例分割方法
本专利技术属于深度学习与计算机视觉
，具体涉及基于一阶段目标检测框架的实例分割方法。
技术介绍
在过去几年中，计算机视觉的目标检测方向取得了巨大的进步，与其具有一定相关性的实例分割任务在借鉴了目标检测框架的强大功能后，也获得了一定的发展。实例分割任务是指在图像中定位出潜在目标的位置，该位置使用检测目标框表示，再用语义分割的方式在不同目标区域内进行逐像素标记，该任务可以在目标检测的基础上进行相应扩展便可完成。不少工作都在对现有成熟的目标检测框架进行扩展，以完成实例分割的任务，但绝大多数工作都是对两阶段目标检测框架进行扩展，这种扩展在保证分割质量的同时，难以兼顾检测速度。2018年，来自FacebookAI研究院的何凯明团队提出的基于两阶段目标检测框架的实例分割方法MaskR-CNN，其简单且灵活的扩展方法使该领域更多地进一步关注目标检测和实例分割任务及其对应方法的共通性和相互扩展功能。然而，该方法目前在取得相应高质的分割结果的同时，牺牲了时间上的效率，这是该方法目前值得改进的地方。MaskR-CNN在时间效率上低效的原因之一是它使用的两阶段目标检测框架原有的问题。本专利技术通过对一阶段目标检测框架的有效扩展，提供更快的实例分割流程，有效解决上述问题。然而，通过一阶段目标检测框架扩展的实例分割方法并不能像MaskR-CNN一样单纯直接扩展mask分支便可以完成相应的实例分割任务。对一阶段目标检测框架进行实例分割任务的扩展，需要解决不同对象检测目标框二义性...

【技术保护点】
1.基于一阶段目标检测框架的实例分割方法，其特征在于，包括：/nS1、将训练图像中的目标对象标注成网络输出层里密集的点对象；/nS2、构建完整的基于一阶段目标检测框架的实例分割网络模型；/nS3、设计一种适应实例分割任务的多任务损失函数用于深度学习训练；/nS4、推断阶段，结合目标检测结果和语义分割结果最终获得实例分割结果。/n

【技术特征摘要】
1.基于一阶段目标检测框架的实例分割方法，其特征在于，包括：
S1、将训练图像中的目标对象标注成网络输出层里密集的点对象；
S2、构建完整的基于一阶段目标检测框架的实例分割网络模型；
S3、设计一种适应实例分割任务的多任务损失函数用于深度学习训练；
S4、推断阶段，结合目标检测结果和语义分割结果最终获得实例分割结果。

2.根据权利要求1所述的基于一阶段目标检测框架的实例分割方法，其特征在于，步骤S3中的多任务损失函数由目标检测框、对象置信度、对象分类和语义分割四部分的损失函数组成，具体如下：
S31、目标检测框部分采用交并比损失函数；
S32、对象置信度部分采用针对对象中心度改进的焦点损失函数，其表达式为：

S33、对象分类部分采用针对多分类任务改进的焦点损失函数，其表达式为：

S34、语义分割部分采用交叉熵损失函数，
其中，yt为标注的实际类别；为指示函数，yt中大于0的部分为1，其余为0；αt为一个[0,0.5]间的小数；γ为一个大于0的数；pt为输出的不同类别的分类概率；Nt为该类别对象在数据集中的数量。

3.根据权利要求2所述的基于一阶段目标检测框架的实例分割方法，其特征在于：在步骤S1中，每个训练图像中所含有的目标对象以密集的点对象形式进行表达，每个尺度下输出大小为[B,H,W]的张量，其中B为批处理大小，H、W为对应尺度的高度和宽度，当且仅当某个对象的检测框包含了张量里的一部分点，这部分点以点对象的形式进行编码，该点对象的编码方式如下：
S11、对象类别编码为one-hot向量，向量长度为C；
S12、对象置信度编码为对象中心度；
S13、目标检测框编码为长度为4的向量(L,R,T,B)；
其中C为分类类别的数量，L、R、T、B分别表示该点对象中心到对应目标检测框的左、右、上、下四端的距离。

4.根据权利要求1所述的基于一阶段目标检测框架的实例分割方法，其特征在于：在步骤S2中，所述基于一阶段目标检测框架的实例分割网络模型，包括主干网络、主体特征提取模块、目标检测模块和语义分割模块，具体如下：
S21、帮助完成基础特征提取的主干网络，包含一个接收图像张量输入...

【专利技术属性】
技术研发人员：罗荣华，李嘉明，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人