【技术实现步骤摘要】
一种基于弱监督学习的生成高质量候选框目标检测方法
[0001]本专利技术属于目标检测领域,特别是涉及一种基于弱监督学习的生成高质量候选框目标检测方法。
技术介绍
[0002]在计算机视觉领域中,目标检测解决的是图像中单个或多个目标定位和分类的问题,当前主流的目标检测方法主要为基于全监督的目标检测方法和基于弱监督目标检测方法。
[0003]近年来,基于弱监督学习的目标检测方法引起了学术界广泛地关注,同时也是工业界视觉检测的迫切需求。基于弱监督的目标检测方法主要分为三类:不完全监督(Incomplete supervision)、不确切监督(Inexact supervision)和不精确监督(Inaccurate supervision),其中,不确切监督(即训练数据只给出粗粒度的图像级标签)学习在目标检测领域最为常见。2016年,Hakan Bilen等人提出了WSDDN(Weakly Supervised Deep Detection Networks)模型,该模型采用了多实例学习的思想,成功的实现了基于图像级标签 ...
【技术保护点】
【技术特征摘要】
1.一种基于弱监督学习的生成高质量候选框目标检测方法,其特征在于,包括以下步骤:获取数据集图片,所述数据集图片包括:源数据集图片和目标数据集图片;构建教师模型,基于所述源数据集图片训练所述教师模型,得到训练好的教师模型;其中所述教师模型为改进的Faster RCNN,所述教师模型的改进点在于最大池化操作转换成多尺度池化操作;构建学生模型,通过训练好的教师模型指导所述学生模型,得到学生特征图;其中所述学生模型为改进的FPN;获取所述目标数据集图片的梯度加权类激活图,将所述学生特征图与所述梯度加权类激活图进行融合,得到高质量的目标候选框图;获取待测数据集图片,将所述待测数据集图片输入所述学生模型,基于所述目标候选框图,得到目标位置信息和分类预测结果。2.根据权利要求1所述的基于弱监督学习的生成高质量候选框目标检测方法,其特征在于,多尺度池化操作的过程包括:基于所述教师模型,得到输入特征图,将所述输入特征图根据通道大小分成若干个组;对所述若干个组分别进行多尺度池化操作
,
根据通道选择对应的池化核,基于所述池化核进行最大池化操作,得到输出特征图;对所述输出特征图进行局部增强,将大于平均池化值的元素替换为最大池化值,其他元素保持不变;将局部增强后的输出特征图进行串联,得到多尺度池化后输出的最终特征图。3.根据权利要求1所述的基于弱监督学习的生成高质量候选框目标检测方法,其特征在于,教师模型的损失函数包括:分类损失和基于smooth L1函数的回归损失。4.根据权利要求1所述的基于弱监督学习的生成高质量候选框目标检测方法,其特征在于,所述学生模型包括:候选框生成模块和多实例目标检测模块;其中所述多实例目标检测模块包括:基础多实例检测模块、多实例分...
【专利技术属性】
技术研发人员:刘康,张海兰,郑颖,胡江昱,王玮岑,吴梦玮,
申请(专利权)人:中国矿业大学北京,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。