【技术实现步骤摘要】
检测框的确定方法、装置、存储介质及电子装置
[0001]本专利技术实施例涉及基于深度学习的目标检测领域,具体而言,涉及一种检测框的确定方法、装置、存储介质及电子装置。
技术介绍
[0002]目标检测是计算机视觉任务里的一项基础且具有挑战性的任务,是学术界的研究热点和工业界的应用热点,在智慧交通、安防监控、工业检测等场景得到广泛应用。由于基于深度学习的目标检测技术速度快,精度高,迭代成熟,因此,大多数目标检测技术选择使用基于深度学习的方法。然而,基于深度学习的方法需要针对待检测的目标类别,采集大量包含该目标类别的图像并进行目标框标注,最后才能将标注后的图像数据用于训练目标检测模型。其中,采集和标注的过程十分耗费人力物力和时间,并且训练过后的模型只能检测标注和训练过的目标类别,无法检测新类别,导致目标检测的通用性较差。小样本目标检测算法旨在只通过少量新类别的目标样本提取该类别目标的特征,以进行新类别目标的检测,实现更为通用的目标检测。其难点在于新类别的目标样本数量很少,如何能从其中提取到核心的特征以及如何利用这些特征进行有效且准确的目标检测。
[0003]在相关技术中,使通常用两阶段的Faster
‑
RCNN架构作为基础框架,输入查询图像和支持集图像提取特征后在跨图像特征融合模块中完成支持集图像特征对查询图像特征的强化,之后送入改进的RPN模块生成ROI特征向量,再通过特征聚合模块对候选框进行筛选并完成支持集向量和ROI特征向量的空间对齐,最后将处理好的ROI和支持向量送入分类器中分类,最终输出 ...
【技术保护点】
【技术特征摘要】
1.一种检测框的确定方法,其特征在于,包括:将待检测图像以及与所述待检测图像对应的第一支持图像集输入至目标检测模型中,利用所述目标检测模型中包括的特征再匹配网络对第一特征以及第二特征进行匹配操作,其中,所述第一特征为所述目标检测模型中包括的主干网络提取到的所述待检测图像的特征,所述第二特征为所述主干网络提取到的所述第一支持图像集的特征;基于所述匹配操作确定所述待检测图像中包括的目标对象的第一检测框;利用目标重识别网络过滤所述第一检测框,确定所述目标对象的目标检测框。2.根据权利要求1所述的方法,其特征在于,在将待检测图像以及与所述待检测图像对应的第一支持图像集输入至目标检测模型中之前,所述方法还包括:获取查询图像,以及与所述查询图像对应的第二支持图像集,其中,所述第二支持图像集中的每张图像中包括的对象与所述查询图像中包括的对象的类别相同;利用所述查询图像以及所述第二支持集图像训练初始检测模型,得到所述目标检测模型。3.根据权利要求2所述的方法,其特征在于,利用所述查询图像以及所述第二支持图像集训练初始检测模型,得到目标检测模型包括:获取与所述查询图像对应的第三支持图像集,其中,所述第三支持图像集中包括的对象的类型与所述查询图像中包括的对象的类型相同;利用所述查询图像、所述第二支持图像集以及所述第三支持图像集训练所述初始检测模型,得到所述目标检测模型。4.根据权利要求3所述的方法,其特征在于,利用所述查询图像、所述第二支持图像集以及所述第三支持图像集训练所述初始检测模型,得到所述目标检测模型包括:针对所述查询图像、所述第二支持图像集以及所述第三支持图像集中的任意一个目标图像,均执行以下操作,得到每个所述目标图像对应的第三特征:将所述目标图像输入至所述初始检测模型中包括的初始主干网络中,得到所述初始主干网络的第N个结构块输出的所述第三特征;基于所述第三特征以及所述初始检测模型中包括的初始区域候选网络确定所述查询图像中包括的对象的查询检测框;从所述查询图像中提取与所述查询检测框的位置对应的检测框特征;基于所述第二支持图像集对应的所述第三特征、所述第三支持图像集对应的所述第三特征以及所述检测框特征以及所述初始检测模型中包括的初始特征再匹配网络修正所述查询检测框,得到第二检测框,并确定所述第二检测框的第一置信度;基于所述第二检测框以及所述第二检测框对应的所述第一置信度确定所述初始检测模型的目标损失值;基于所述目标损失值更新所述初始检测模型的网络参数,得到所述目标检测模型。5.根据权利要求4所述的方法,其特征在于,基于所述第三特征以及所述初始检测模型中包括的初始区域候选网络确定所述查询图像中包括的对象的查询检测框包括:对所述第二支持图像集对应的所述第三特征依次进行全局最大池化操作以及均值融合操作,得到第四特征;将所述查询图像对应的所述第三特征与所述第四特征进行广播点乘,得到第五特征;
对所述第三支持图像集对应的所述第三特征依次进行全局最大池化操作以及均值融合操作,得到第六特征;将所述查询图像对应的所述第三特征与所述第六特征进行广播点乘,得到第七特征;将所述第五特征输入至所述初始区域候选网络中,得到第一分类特征以及第一定位特征,以及将所述第七特征输入至所述初始区域后续网络中,得到第二分类特征以及第二定位特征;基于所述第一分类特征、所述第一定位特征、所述第二分类特征以及所述第二定位特征确定所述查询检测框。6.根据权利要求5所述的方法,其特征在于,基于所述第一分类特征、所述第一定位特征、所述第二分类特征以及所述第二定位特征确定所述查询检测框包括:基于所述第一定位特征确定所述查询图像中包括的对象的第一定位预测框;从所述第一定位预测框确定出第一前景预测框以及第一背景预测框;基于所述第二定位特征确定所述查询图像中包括对象的第二背景预测框;从所述第一前景预测框、所述第一背景预测框以及所述第二背景预测框中选取第二定位预测框以及第三背景预测框;基于所述第一分类特征以及所述第二分类特征确定所述第二定位预测框的第二置信度以及所述第三背景预测框的第三置信度;基于所述第二置信度以及所述第三置信度对所述第二定位预测框以及所述第三背景预测框进行非极大值抑制,得到第三定位预测框;将所述第三定位预测框确定为所述查询检测框。7.根据权利要求4所述的方法,其特征在于,基于所述第二支持图像集对应的所述第三特征、所述第三支持图像集对应的所述第三特征以及所述检测框特征以及所述初始检测模型中包括的初始特征再匹配网络修正所述查询检测框,得到所述第二检测框包括:基于所述第二支持图像集中的每张图像的第一标注框坐标从所述第二支持图像集对应的所述第三特征中提取第八特征;基于所述第三支持图像集中的每张图像的第二标注框坐标从所述第三支持图像集对应的所述第三特征中提取第九特征;针对所述第八特征、所述第九特征以及所述检测框特征中的任意一个第一目标特征均执行以下操作,得到与每个特征对应的第十特征:将所述第一目标特征输入至所述初始主干网络的第M个结构块中,得到所述第十特征;对与所述第八特征对应的所述第十特征进行均值融合操作,得到第十一特征,以及对与所述第九特征对应的所述第十特征进行均值融合操作,得到第十二特征;将与所述第八特征对应的所述第十特征、所述第十一特征以及所述第十二特征输入至所述初始特征再匹配网络中,以修正所述查询检测框,得到所述第二检测框。8.根据权利要求7所述的方法,其特征在于,将与所述第八特征对应的所述第十特征、所述第十一特征以及所述第十二特征输入至所述初始特征再匹配网络中,以修正所述查询检测框,得到所述第二检测框包括:对与所述第八特征对应的所述第十特征进行全局均...
【专利技术属性】
技术研发人员:蒋伟,孙鹤,潘华东,殷俊,
申请(专利权)人:浙江大华技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。