一种基于特征迁移的半监督实例分割算法制造技术

技术编号：27658474 阅读：20 留言：0更新日期：2021-03-12 14:23

本发明专利技术公开了一种基于特征迁移的半监督实例分割模型。该模型以Mask R‑CNN网络为基础，构建了一个基于逆卷积神经网络的特征迁移模块，将Mask R‑CNN目标检测分支学习的图像视觉特征转化为用于分割预测的特征。为了解决Mask R‑CNN目标检测分支输出特征分辨率与分割预测分支特征分辨率不匹配的问题，该模型的特征迁移模块中使用了逆卷积网络层对输入特征进行上采样。该模型通过特征迁移过程能有效提升Mask R‑CNN基准模型的半监督实例分割精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于特征迁移的半监督实例分割算法一、
本专利技术涉及图像分割
，尤其涉及图像分割中的实例分割领域，是一种基于特征迁移的半监督实例分割算法。二、
技术介绍
实例分割是自动驾驶、生物医学图像处理和机器人视觉控制等研究领域的关键技术。它需要对图像中的指定目标实例同时进行定位、分类和区域分割。实例分割是一项具有很大应用潜力，致力于改善人们日常生活的热门研究，并在生活场景和技术研究中有许多重要应用。例如对俯瞰城市地表图像进行分割用于体育场地改进、生物医学中的显微图像分割，利用机器视觉控制机器人抓取物体以及对自动驾驶的车载图像实例分割用于区别行人、道路和车辆等。近些年来，深度学习利用其具有自动化特征提取的优势，在许多图像处理任务上取得了突破性的进展。在实例分割算法方面，基于监督学习的分割模型，如MaskR-CNN(HeK,GkioxariG,DollárP,etal.Maskr-cnn[C]//ProceedingsoftheIEEEinternationalconferenceoncomputervision.2017:2961-2969.)和MaskLab(ChenLC,HermansA,PapandreouG,etal.Masklab:Instancesegmentationbyrefiningobjectdetectionwithsemanticanddirectionfeatures[C]//ProceedingsoftheIEEEConferenceonComputerVisionandPatter...

【技术保护点】
1.一种基于特征迁移的半监督实例分割算法，其特征在于：/n通过在Mask R-CNN模型目标检测分支最后一个卷积网络层与分割预测分支原逆卷积网络层之间建立特征迁移模块，以实现特征迁移半监督实例分割；利用半监督实例分割数据集对该模型进行训练，将目标检测分支学习的物体视觉特征用于提升分割预测的性能；/n具体做法是：/n建立特征迁移半监督实例分割模型；本专利技术提出的特征迁移半监督实例分割模型称为FT-Mask(Feature Transfer Mask R-CNN)；整个模型主要分为共享网络前部、上半部分目标检测分支、下半部分分割预测分支和中间部分的特征迁移模块；其中共享网络前部用于提取图像的视觉特征，随后RoIAlign层将这些视觉特征提取为感兴趣区域(Region ofInterest，RoI)特征；目标检测分支和分割预测分支分别将RoI特征用于目标检测预测和目标分割掩膜预测；/n模型的目标检测分支在训练时通过具有检测标签的A∪B数据集(A数据集的完整实例分割标注包含了目标检测标注)进行学习，分割预测分支通过含有分割标签标注的A数据集进行学习；FT-Mask模型在训练时同时利用了完整实...

【技术特征摘要】
1.一种基于特征迁移的半监督实例分割算法，其特征在于：
通过在MaskR-CNN模型目标检测分支最后一个卷积网络层与分割预测分支原逆卷积网络层之间建立特征迁移模块，以实现特征迁移半监督实例分割；利用半监督实例分割数据集对该模型进行训练，将目标检测分支学习的物体视觉特征用于提升分割预测的性能；
具体做法是：
建立特征迁移半监督实例分割模型；本发明提出的特征迁移半监督实例分割模型称为FT-Mask(FeatureTransferMaskR-CNN)；整个模型主要分为共享网络前部、上半部分目标检测分支、下半部分分割预测分支和中间部分的特征迁移模块；其中共享网络前部用于提取图像的视觉特征，随后RoIAlign层将这些视觉特征提取为感兴趣区域(RegionofInterest，RoI)特征；目标检测分支和分割预测分支分别将RoI特征用于目标检测预测和目标分割掩膜预测；
模型的目标检测分支在训练时通过具有检测标签的A∪B数据集(A数据集的完整实例分割标注包含了目标检测标注)进行学习，分割预测分支通过含有分割标签标注的A数据集进行学习；FT-Mask模型在训练时同时利用了完整实例分割标注的数据和弱标注的数据，因此其训练过程为半监督训练；
模型特征迁移模块将目标检测分支卷积网络层输出的特征图作为输入，对特征图中的视觉知识进行“迁移”后得到输出特征图；特征迁移模块输出的特征图和原分割预测特征图通过对应通道相加操作连接后作为分割分支中逆卷积网络层的输入；分割预测分支的逆卷积层将输出特征图尺寸放大至原来的两倍，其后是用于分割预测的卷积核大小为1×1的卷积层；对FT-Mask模型进行半监督训练后，其特征迁移模块就可以有效地将目标检测分支学习的知识转化为用于分割预测的知识；

2.如权利要求1所述的基于特征迁移的半监督实例分割算法，其特征在于：建立特殊的特征迁移模块：
本发明提出使用特征迁移方法实现知识迁移，并设计了一个特定的特征迁移模块以模拟知识迁移函数；本发明设计的特征迁移模块由基本特征迁移模块和分割聚合模块构成；其中，基本特征迁移模块两端为逆卷积网络层，中间的省略号部分为多个卷积网络层；而分割聚合模块的此网络层只有一个输出通道，其输出的单通道特征图“聚合”了目标检测分支输出特征所有通道的信息；上下两个部分的输出特征连接时，分割聚合模块输出的单通道特征图与基本特征迁移模块输出特征图的每一个通道对...

【专利技术属性】
技术研发人员：陈彦如，廖俊华，杨学文，刘诗佳，张媛媛，魏亮雄，赵万槟，梁刚，许春，张磊，陈良银，
申请(专利权)人：成都易书桥科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人