【技术实现步骤摘要】
一种基于小样本的目标检测方法
[0001]本专利技术涉及计算机视觉与深度学习领域,具体是一种基于小样本的目标检测方法。
技术介绍
[0002]基于数字图像进行目标检测是很多自动化应用的关键技术环节。传统以图像处理为主的检测方法主要依靠颜色、形状和纹理等特征,往往需要较多的人工干预,才能选择到合适的特征以实现目标的准确提取,工作复杂且计算量大。近年来,以两阶段的R
‑
CNN系列和一阶段的YOLO系列算法为代表的深度学习算法在目标检测任务上取得了重大的性能突破,在目标的检测和分类任务上的精确度都取得了很大的提升,拥有良好的性能。但这些方法往往依赖大量的标记数据,数据获取成本高。尤其是对某些应用,例如水下生物、果园水果等,采集训练数据和标注数据都需要大量的时间和人工成本。
[0003]基于该类检测场景存在的问题,小样本目标检测越来越受到关注。小样本目标检测算法的目的是仅需要少量的新类标注数据,就可以让模型学习到新类的特征,并在检测任务中具备检测新类目标的能力。
[0004]目前,小样本目标检测主要 ...
【技术保护点】
【技术特征摘要】
1.一种基于小样本的目标检测方法,其特征在于,包括如下步骤:S1:图像采集:在真实环境中,使用图像采集设备对拟测目标进行实景拍摄,获取待测目标的图像;S2:图像预处理:将获取的图像的格式统一转换成JPG格式,并将图像大小统一为1920x1280像素,使用LabelImg标注软件对每张图像中的目标进行标注,构建小样本目标检测数据集,数据集遵循Pascal VOC的标注格式和目录结构,并按照小样本目标检测的划分方法,将数据集进行划分并生成配置文件;S3:构建小样本目标检测模型,以Faster R
‑
CNN作为小样本目标检测的基本框架,该框架主要由主干特征提取网络、RPN网络和检测网络组成,并在此框架的基础上,加入了梯度解耦模块、对比编码模块;主干特征提取网络:由主干网络和FPN构成,主干网络采用残差结构的ResNet 101,包含一个7x7的卷积层Conv1和四个残差结构Conv2_x、Conv3_x、Conv4_x、Conv5_x,四个残差结构分别输出4个特征图CM2、CM3、CM4、CM5,FPN分别使用1x1的卷积层调整输入特征图的通道数,然后通过上采样将特征图CM2、CM3、CM4、CM5进行融合,得到融合后的特征图M2、M3、M4、M5,融合后的特征图再分别经过3x3的卷积层后得到特征图P2、P3、P4和P5,并在P5的基础上使用Maxpool操作进行下采样得到特征图P6;RPN网络:用于在特征图P2、P3、P4、P5和P6上预测候选区域,并将候选区域映射到特征图P2、P3、P4和P5中,作为后续网络的输入;检测网络:包含ROIpooling层、ROI特征提取器、分类器和回归器;ROIpooling层将RPN网络生成的候选区域作为输入,对主干特征提取网络输出的特征P2、P3、P4、P5和P6进行ROI pooling操作,生成不同尺度的候选区域特征并将其统一为7x7的尺寸进行特征输出;ROI特征提取器由全连接层组成,负责提取整体的特征信息,融合全局特征和候选区域特征,输出到分类器和回归器用于检测;分类器负责确定目标候选框中目标的类别信息,分类损失为交叉熵损失,如下所示:L
cls
=L
cls
(p,u)=
‑
logp
u
其中,u为目标的真实标签,p为分类器预测的softmax概率分布p=p(p0,...,p
k
),p
u
表示分类器预测当前候选区域为类别u的概率;回归器负责调整目标候选框的位置,回归损失为Smoothed
‑
L1损失,如下所示:如下所示:其中,t
u
为回归器预测的对应类别u的边界框回归参数,v为真实目标的边界框回归参数,为Smoothed
‑
L1函数;梯度解...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。