一种基于多尺度融合的快速目标检测方法技术

技术编号：25837305 阅读：25 留言：0更新日期：2020-10-02 14:17

本发明专利技术公开了一种基于多尺度融合的快速目标检测方法，包括：S1：将待检测图像输入Darknet53特征提取器提取待检测图像特征图；S2：将Darknet53特征提取器提取的特征图输入至多特征融合模块；S3：将多特征融合模块获得的特征信息输入至多尺度聚合模块；S4：将多尺度聚合模块获得的特征信息输入至具有空间注意力机制的残差预测模块，输出目标检测结果。本发明专利技术所构建的多特征融合模块，通过将可学习的加权参数自适应分配给三个不同的卷积分支，提高目标检测模型的多特征表示能力。检测网络的四条输出分支通过多尺度聚合模块自上而下的增强了网络的多尺度检测能力。在预测模块中使用空间注意力，使网络更好地定位物体的位置信息。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多尺度融合的快速目标检测方法
本专利技术涉及深度学习中的目标检测
，特别涉及一种基于多尺度融合的快速目标检测方法。
技术介绍
近年来，随着深度学习的不断发展，基于深度学习的目标检测技术得到了广泛的应用。在现实生活的场景中，目标检测受到多种因素的干扰，如：光照、遮挡等。如何快速地、准确地对复杂场景下的目标进行检测、识别已经成为一个值得深入研究的课题。目标检测技术是利用计算机视觉技术判断静态图像或动态视频中是否存在感兴趣的物体，正确识别物体类别，并定位物体的位置信息。现有的目标检测方法一般分为两大类：两阶段法和单阶段法。两阶段法首先使用区域推荐网络获得若干候选框；然后这些候选框再通过特征提取网络提取图像特征，最后进行分类和位置回归。两阶段法一般具有较高的检测准确性，但是检测速度较慢。单阶段法将目标检测当做回归问题来解决，同时训练和检测放在一个网络中。相比于两阶段法，单阶段法一般具有更好的检测实时性。
技术实现思路
为了克服现有技术中的不足，本专利技术提供一种基于多尺度融合的快速目标检测方法，通过提出一种多特征融合模块来改善现有检测网络的多尺度特征表达能力，此外，通过提出一种具有空间注意力构建块的残差预测模块，使网络更好的定位目标的位置信息。为了达到上述专利技术目的，解决其技术问题所采用的技术方案如下：一种基于多尺度融合的快速目标检测方法，包括以下步骤：步骤S1：将待检测图像输入Darknet53特征提取器提取待检测图像特征图；步骤S2：将步骤S1中Dark...

【技术保护点】
1.一种基于多尺度融合的快速目标检测方法，其特征在于，包括以下步骤：/n步骤S1：将待检测图像输入Darknet53特征提取器提取待检测图像特征图；/n步骤S2：将步骤S1中Darknet53特征提取器提取的特征图输入至多特征融合模块；/n步骤S3：将步骤S2中多特征融合模块获得的特征信息输入至多尺度聚合模块；/n步骤S4：将步骤S3中多尺度聚合模块获得的特征信息输入至具有空间注意力机制的残差预测模块，输出目标检测结果。/n

【技术特征摘要】
1.一种基于多尺度融合的快速目标检测方法，其特征在于，包括以下步骤：
步骤S1：将待检测图像输入Darknet53特征提取器提取待检测图像特征图；
步骤S2：将步骤S1中Darknet53特征提取器提取的特征图输入至多特征融合模块；
步骤S3：将步骤S2中多特征融合模块获得的特征信息输入至多尺度聚合模块；
步骤S4：将步骤S3中多尺度聚合模块获得的特征信息输入至具有空间注意力机制的残差预测模块，输出目标检测结果。

2.根据权利要求1所述的一种基于多尺度融合的快速目标检测方法，其特征在于，步骤S2具体包括以下内容：
一个多特征融合模块由卷积核为3×3、1×3、3×1三个平行分支组成，对于多特征融合模块中的一个分支，I∈M×N×D表示卷积层的输入，使用F＝[g1，g2，…，gc]表示学习的卷积核集，其中gc表示对应的第c个卷积核的参数，U∈H×W×C表示卷积层的输出，H、W、C分别表示输出特征图的高度、宽度、通道数，对于该层的第c个滤波器，对应的输出特征图通道为：

其中，*表示卷积，gc∈K×K×D，U＝[V1，V2，...，VC]，I＝[Y1，Y2，...，YD]和表示gc的单个通道的二维空间核，Vc表示U的第c个输出特征图通道，Ys表示I的第s个输入特征图通道；
为了减少过拟合，在卷积层之后采用批量归一化操作，批处理后的归一化层进行线性尺度变换以增强网络的表示能力，输出特征映射通道变为：

其中，uc和σc表示通道平均值和批量归一化的标准偏差，γc和βc分别表示学习尺度因子和偏差项；
最终，可学习的权重被添加到多特征融合模块的三个分支中，对应的融合输出特征图通道可以计算为：

其中，Vfusionc表示三个平行分支对应的第c个融合输出特征图通道，Wic和Vic表示三个平行分支的相应权重和相应第c个输出特征图通道，其中i∈{1，2，3}。

3.根据权利要求2所述的一种基于多尺度融合的快速目标检测方法，其特征在于，步骤S3中所述多尺度聚合模块由两个操作符组成，分别为一个上采样操作和一个...

【专利技术属性】
技术研发人员：杨振坤，扶梅，马向华，朱丽，
申请(专利权)人：上海应用技术大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人