一种基于多尺度特征图的目标快速检测方法技术

技术编号：18895624 阅读：54 留言：0更新日期：2018-09-08 11:29

本发明专利技术公开了一种基于多尺度特征图的目标快速检测方法。包括以下步骤：首先，通过卷积神经网络自动提取多尺度特征图，避免了传统方法中复杂的特征设计及提取过程。其次，考虑到不同卷积层学习到的特征表达各不相同，提出一种有效的特征图融合方法，并通过轻量级的压缩型双线性函数来实现，以提升特征图融合效率，丰富上下文信息。在此基础上，将多尺度特征图与通道注意机制结合，突出有用信息，抑制冗余信息，进一步增强特征图的表征能力。最后，将增强后的多尺度特征图用于目标检测，通过多次迭代训练得到最优模型。相比现有技术，本发明专利技术所提方法在提升检测精度的同时尽量降低时间成本，实现了目标的快速检测，在移动机器人、自动驾驶及智能视频监控等方面具有广阔的应用前景。

A fast target detection method based on multi-scale feature map

The invention discloses a fast target detection method based on multi-scale feature maps. It includes the following steps: Firstly, multi-scale feature map is automatically extracted by convolution neural network, which avoids the complex feature design and extraction process in traditional methods. Secondly, considering that different convolution layers have different features, an effective feature graph fusion method is proposed, which is implemented by a lightweight compression bilinear function to improve the efficiency of feature graph fusion and enrich the context information. On this basis, the multi-scale feature map is combined with the channel attention mechanism to highlight useful information, suppress redundant information, and further enhance the characterization ability of the feature map. Finally, the enhanced multi-scale feature map is applied to target detection, and the optimal model is obtained by iterative training. Compared with the existing technology, the method of the invention can improve the detection accuracy and reduce the time cost as far as possible, and realize the rapid detection of the target. It has broad application prospects in mobile robot, automatic driving and intelligent video surveillance.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多尺度特征图的目标快速检测方法
本专利技术涉及一种基于多尺度特征图的目标快速检测方法，属于计算机视觉与智能信息处理领域。
技术介绍
目标检测，作为其他高层视觉处理和分析任务的基础，一直是计算机视觉领域的核心问题之一，在移动机器人、自动驾驶以及智能视频监控系统等诸多方面具有重要的经济和实用价值，潜力巨大。针对海量的图像数据和动态变化的场景，高效地获取并识别各类感兴趣目标，实现精确而快速的目标检测，具有重要意义。传统的目标检测方法依赖于人工设计特征，并将提取的特征输入分类器进行分类与识别。然而，人工设计特征存在诸多局限，如数据规模较小，泛化能力差，难以应用于复杂多变的实际场景等。近年来，深度学习，尤其是卷积神经网络在计算机视觉领域和自然语言处理领域的巨大成功，引发了学者浓厚的研究兴趣。随着一系列深度卷积神经网络的提出，如AlexNet、VGGNet、GoogLeNet、ResNet以及DenseNet等，目标检测方法的研究取得了飞跃性的进展。目前，基于深度学习的目标检测与识别方法大致分为两类：基于区域建议的方法和无区域建议的方法。基于区域建议的方法大致遵循区域建议、特征表示和区域分类三个步骤，包括R-CNN系列方法，取得了较高的检测精度，但计算复杂度相对较高，难以满足实时性的应用需求。无区域建议的方法一般采用回归的思想来检测边框位置及所属类别，主要包括YOLO、SSD等。无区域建议的方法突破了实时性方面的瓶颈，但是检测效果有限，对相互靠近的群体以及小目标检测精度不高。因此，如何在提高检测精度的同时兼顾速度，实现精确的目标快速检测，逐渐成为目标检测方向的...

【技术保护点】
1.一种基于多尺度特征图的目标快速检测方法，其特征在于包括以下步骤：步骤一：搭建卷积神经网络，以包含5组卷积层的VGG‑16模型作为基础网络，并添加多个额外的卷积层，初步提取多尺度的卷积特征图；步骤二：构建卷积特征图融合模块，将基础网络中Conv5_3层与FC7层的特征图进行融合，增加特征来源，丰富上下文信息；步骤三：使用一种压缩型双线性函数实现特征图的融合，得到融合后的特征图；步骤四：将多尺度特征图与通道注意机制结合，进一步增强特征图的判别能力；步骤五：将增强后的多尺度特征图输入检测模型，在训练阶段同时对目标位置和类别进行回归，通过多次迭代最小化损失函数，直至得到性能较好的检测模型。

【技术特征摘要】
1.一种基于多尺度特征图的目标快速检测方法，其特征在于包括以下步骤：步骤一：搭建卷积神经网络，以包含5组卷积层的VGG-16模型作为基础网络，并添加多个额外的卷积层，初步提取多尺度的卷积特征图；步骤二：构建卷积特征图融合模块，将基础网络中Conv5_3层与FC7层的特征图进行融合，增加特征来源，丰富上下文信息；步骤三：使用一种压缩型双线性函数实现特征图的融合，得到融合后的特征图；步骤四：将多尺度特征图与通道注意机制结合，进一步增强特征图的判别能力；步骤五：将增强后的多尺度特征图输入检测模型，在训练阶段同时对目标位置和类别进行回归，通过多次迭代最小化损失函数，直至得到性能较好的检测模型。2.根据权利要求1所述的基于多尺度特征图的目标快速检测方法，其特征在于：步骤一中所述的卷积神经网络模型主要包括从Conv1到Conv5的5组卷积层，由全连接层转变的卷积层FC6和FC7，末端添加的一系列级联卷积层，及激活层、池化层等。3.根据权利要求1所述的基于多尺度特征图的目标快速检测方法，其特征在于：步骤二中所述构建卷积特征图融合模块：卷积神经网络通过不同的卷积核自行提取特征，将原始数据经过一些非线性变换转变为更高层次的、更加抽象的表达，再进行分类识别，考虑到每一个卷积层所学习的特征表达均不同，本发明在采用6组不同特征图的基础上，增加了基础网络中卷积层Conv5_3的特征图，并将其与FC7层特征图进行融合，以增强特征图的表达能力。4.根据权利要求1所述的基于多尺度特征图的目标快速检测方法，其特征在于：步骤三所述的融合方法包括以下步骤：(1)考虑到待融合的卷积特征图通道数不同，在融合之前先引入卷积核大小为1×1的卷积层，在通道的维度上进行线性组合，以统一特征图的通道数；(2)采用压缩型双线性函数来实现卷积特征图的融合，将传统的双线性变换看成一种多项式核函数，并根据TensorSketch方法来近似地计算出融合后的D维向量，令F1,F2∈RH×W×C分别表示两组特征图，H、W和C分别表示特征图的长、宽和通道数，则在位置(h,w)处分别存在C维的特征向量f1(h,w),f2(h,w)∈RC，这里h∈[1,H]，w∈...

【专利技术属性】
技术研发人员：何小海，单倩文，滕奇志，吴晓红，卿粼波，王正勇，余艳梅，
申请(专利权)人：四川大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人