基于注意力机制的上下文特征融合筛选的小目标检测方法技术

技术编号：24500476 阅读：22 留言：0更新日期：2020-06-13 04:53

本发明专利技术公开了一种基于注意力机制的上下文特征融合筛选的小目标检测方法，该方法包括四个步骤：（1）将基于弱监督学习的图像分割标注与目标检测标注匹配，然后构造适用于基于注意力机制的上下文特征融合和筛选的小目标检测数据集；（2）构建基于语义分割和目标检测的多任务深度网络及其交互共享结构；（3）通过语义可视化分析优化小目标检测网络上下文特征融合和筛选能力；（4）训练基于注意力机制的上下文特征融合和筛选的神经网络模型进行小目标检测。本发明专利技术对图像中的小目标检测具有较好准确度，优于其它小目标检测方法。

Small target detection method based on context feature fusion and selection based on attention mechanism

全部详细技术资料下载

【技术实现步骤摘要】
基于注意力机制的上下文特征融合筛选的小目标检测方法
本专利技术涉及图像中小目标检测，特别涉及一种基于注意力机制的上下文特征融合筛选的小目标检测方法。
技术介绍
实时、高精度的目标检测是实现计算机有效视觉感知的关键步骤和必须克服的难点。近年来，深度学习和卷积神经网络的发展使计算机视觉研究和技术取得了突破性进展，尤其针对目标检测任务，实现了将检测任务与识别任务统一到一个神经网络框架中，在实时性与精度两个方面均远远超越了传统目标检测方法。然而，当待检测目标在不同视距与场景中尺度变化较大时，现有的深度网络模型仍不能有效地检测出小尺度目标。在实际应用场景中，目前的深度网络模型对小目标的检测与识别性能仍无法满足大量应用场景中的实际需求，提高深度网络模型对小目标的检测和识别精度具有重要的应用前景，该方向的研究成果可以推广应用到人脸和行人检测、智能交通、公共安全、机器人导航、医疗辅助诊断等，从而促进深度学习技术在机器视觉和人工智能领域的更广泛应用。融合目标候选区及附近上下文信息，挖掘并利用小目标与场景之间的相互关系，提高小目标的检测精度。可以将目标上下文信息较全面地概括为三类：①语义上下文(Semanticcontext),即目标与其他目标类别及场景等相关联的语义信息；②尺度上下文(Scalecontext),即目标之间的尺度大小关系；③空间上下文(Spatialcontext),即目标与附近其它目标的空间位置关系。DeepIDNet通过融合图像分类与目标检测，利用目标与图像全局场景相关的语义上下文信息提高检测精度；...

【技术保护点】
1.一种基于注意力机制的上下文特征融合筛选的小目标检测方法，其特征在于，包括以下步骤：/n(1)将基于弱监督学习的图像分割标注与目标检测标注匹配，然后构造适用于基于注意力机制的上下文特征融合和筛选的小目标检测数据集；/n(2)构建基于语义分割和目标检测的多任务深度网络及其交互共享结构；/n(3)通过语义可视化分析优化小目标检测网络上下文特征融合和筛选能力；/n(4)训练基于注意力机制的上下文特征融合和筛选的神经网络模型进行小目标检测。/n

【技术特征摘要】
1.一种基于注意力机制的上下文特征融合筛选的小目标检测方法，其特征在于，包括以下步骤：
(1)将基于弱监督学习的图像分割标注与目标检测标注匹配，然后构造适用于基于注意力机制的上下文特征融合和筛选的小目标检测数据集；
(2)构建基于语义分割和目标检测的多任务深度网络及其交互共享结构；
(3)通过语义可视化分析优化小目标检测网络上下文特征融合和筛选能力；
(4)训练基于注意力机制的上下文特征融合和筛选的神经网络模型进行小目标检测。

2.根据权利要求1所述的一种基于注意力机制的上下文特征融合筛选的小目标检测方法，其特征在于，步骤(1)所述的将基于弱监督学习的图像分割标注与目标检测标注匹配，然后构造适用于基于注意力机制的上下文特征融合和筛选的小目标检测数据集，具体实现步骤为：
利用两任务目标的相似性，根据目标检测训练数据集的位置坐标与目标类别的标注信息，按像素级图像分割需求对目标检测训练图像集进行标注；将仅含目标候选区域及目标类别标注信息的图像集中的所有图像iw，分割标注为包含弱监督信息的语义分割图像mw，记C表示目标类别的集合，且其中包含背景类别c0；分割图像mw的任一位置像素u标记为类别c的概率为且使用不同的颜色标记该像素以区别不同类别，用全部语义分割图像mw构成的弱监督训练集训练语义分割网络分支用网络模型预测的任一图像iw在像素位置u处的类别为c的概率为

3.根据权利要求2所述的一种基于注意力机制的上下文特征融合筛选的小目标检测方法，其特征在于，步骤(2)所述的构建基于语义分割和目标检测的多任务深度网络及其交互共享结构，具体实现步骤为：
1)在参数共享的多尺度特征重建模块基础上，串接全卷积网络作为图像语义分割分支的主体，浅层特征通过Skip-Connection残差模块与深卷积层输出的语义分割特征相加融合，预测语义分割图像，所述的残差模块含一组卷积层Convα；深卷积层输出的语义分割特征通过注意力机制计算语义分割注意力概率得分，注意力机制与Skip-Connection残差模块共享卷积层参数，再根据注意力概率得分筛选浅层卷积特征；将筛选后不同尺度大小的浅层特征按不同池化核自适应池化为同一尺寸，最终合并联结为用于目标检测的特征，并经RPN生成候选框；再对候选框样本逐个进行多类别分类以及候选框坐标回归；
2)利用目标检测的训练集训练语义分割网络分支，以最小化注意力分割损失函数，更新Skip-Connection残差模块卷积层参数，浅层的多尺度特征通过Skip-Connection残差模块直接与深层分割语义特征融合提升语义分割精度，与此同时，注意力概率分布的通道与目标类别建立对应关系；通过注意力机制，多尺度特征与语义分割特征筛选、融合为用于目标检测的特征，提升目标检测精度；
3)在RPN生成的候选框中...

【专利技术属性】
技术研发人员：赵仲秋，班名洋，沈浩，黄德双，
申请(专利权)人：合肥工业大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人