一种基于制造技术

技术编号：39521615 阅读：9 留言：0更新日期：2023-11-25 19:00

本发明专利技术涉及城市交通车辆管理技术领域，且公开了一种基于

全部详细技术资料下载

【技术实现步骤摘要】
一种基于YOLOV5融合多目标特征增强网络和注意力机制的交通小目标检测方法

[0001]本专利技术涉及城市交通车辆管理
，具体为一种基于
YOLOV5
融合多目标特征增强网络和注意力机制的交通小目标检测方法
。

技术介绍

[0002]随着无人机性能的不断提升和应用场景的不断扩展，利用无人机作为城市交通新的感知模块，可以帮助监控交通系统，检测道路上的车辆，行人，自行车等交通小目标，促进智能交通系统的组成，预防事故的发生
。
但随着汽车保有量的增加，城市道路交通经常会出现密集场景中目标重叠的现象，由于各目标相互遮挡较多
,
极易造成漏检和重复检测等情况
。
通过对基于原有算法进行改进，使其对小目标的检测精度和准确率得以提升，为此，提出一种基于
YOLOV5
融合多目标特征增强网络和注意力机制的交通小目标检测方法
。

技术实现思路

[0003]本专利技术的目的在于提供一种基于
YOLOV5
融合多目标特征增强网络和注意力机制的交通小目标检测方法，以解决上述
技术介绍
中提出随着汽车保有量的增加，城市道路交通经常会出现密集场景中目标重叠的现象，由于各目标相互遮挡较多
,
极易造成漏检和重复检测等情况
。
通过对基于原有算法进行改进，使其对小目标的检测精度和准确率得以提升的问题
。
[0004]为实现上述目的，本专利技术提供如下技术方案：一种基于/>YOLOV5
融合多目标特征增强网络和注意力机制的交通小目标检测方法，包括以下步骤：步骤
1、
对图片进行预处理获得主要的特征数据；步骤
2、
将预处理的特征图送入主干网络中进行特征提取以及利用
CBAM
注意力机制对特征通道进行重组，赋予关键特征较大的权重来突出小目标的语义信息和细节特征；步骤
3、
经过主干网络重组后的特征图输入到特征增强网络中，通过优化多尺度特征重组模块，在原有基础上添加更适合小目标的检测头，使其能检测到
16
像素的小目标特征，对其中可能存在的目标进行候选框标定，同时利用深度可分离卷积代替特征增强网络中的普通卷积，以此来减少参数数量和加速模型推理速度提高感受野和特征表达能力；步骤
4、
经过特征增强网络处理的特征图送入目标检测网络中，根据位置损失函数的结果对候选框的位置进行修正，同时利用非极大值抑制算法抑制和删除多余候选框进而输出更精确的检测结果
。
[0005]作为本技术方案进一步优选的：步骤2中将输入的图片进行数据增强的预处理，处理后的图片送入深度神经网络进行训练，并输出训练后的模型，在主干网络中对输入的图片使用
Mosaic
数据增强算法，对图片进行随机翻转，平移，裁剪的方式将四张图片拼接成一张图片，提升数据的多样性和丰富性
。
[0006]作为本技术方案进一步优选的：将图片的特征图，输入主干网络中进行
特征提取，使用一种
CBAM
注意力模块对特征图不同通道进行重组，赋予关键特征较大的权重来突出小目标的语义信息和细节特征，并降低不相关特征，比如背景，对目标特征提取造成的负面影响
。
[0007]作为本技术方案进一步优选的：利用全局平均池化的方式对特征图进行降维，其中
C
表示通道数，
H
表示高度，
W
表示宽度，得到通道的全局特征描述，具体的操作过程如下所示：其中
C
表示通道数，表示不同通道上的特征点信息；全连接网络层对获取的全局特征进行映射，学习到每个通道的重要性权重，将通道权重与原始特征图相乘，以调整通道特征的表示，增强重要通道的表征能力，具体的操作过程如下所示：其中，为
sigmoid
函数，，为表示利用平均池化和最大池化在空间上生成的特征映射，和表示两个多层感知机网络分别对最大池化和平均池化的结果进行融合处理；经过通道维度上最大池化和平均池化的操作，得到两种不同的空间特征表示，使用一层卷积操作对两种空间特征进行融合，通过学习卷积核的权重，捕捉不同位置之间的相关性，将学习到的空间权重与原始特征图相乘，得到经过空间注意力调整的特征图，强调重要区域的空间信息，以此来提高航拍图中小目标特征的权重，提升对小目标的全局感知，具体的操作过程如下所示：其中，为
sigmoid
函数，是卷积核尺寸为的卷积操作，表示一个
MLP
网络用于融合平均池化和最大池化的结果
。
[0008]作为本技术方案进一步优选的：步骤3中输出的特征图送入到特征增强网络中进行多尺度特征重组的操作，在原有模型的基础上进行修改，新添加一个4倍下采样的小目标检测头，使其能检测到
16
像素的小目标特征
。
[0009]作为本技术方案进一步优选的：步骤3中利用深度可分离卷积代替特征增强网络中的普通卷积，采用深度信息和空间信息分离逐层处理的方式减少参数数量的同时加速模型推理速度提高感受野和特征表达能力，控制过拟合以及节省内存消耗
。
[0010]作为本技术方案进一步优选的：首先利用深度卷积对输入特征进行共享特征提取，提取的特征分别用于后续的空间注意力权重和通道注意力权重计算，具体操作过程如下所示：
其中是单个深度层的输出，是输入数据，是过滤矩阵
,
表示空间维度上的位置坐标，
H
和
W
是过滤器的高度和宽度，
c
是输入通道的索引，
k
是输出通道的索引；再经过逐点卷积在深度上使用
1X1
的卷积核将不同通道的特征图进行逐元素相加或者逐元素相乘的操作，实现特征的整合和交互，具体操作过程如下所示：其中
y
是输出数据，
v
是权值矩阵，
c,k
表示输入通道数和输出通道数
。
[0011]作为本技术方案进一步优选的：步骤4中的内容进入最后的目标识别阶段，根据位置损失函数的结果对候选框的位置进行修正，进而输出更精确的检测结果，首先计算预测框与真实框相交部分面积与两框相并部分面积的比值，也称为交并比
Iou
：其中表示两框相交部分的面积，表示两框相并部分的面积；对于每个预测框，首先计算它与其他所有预测框的
IOU
，将结果按照置信度从高到低排序；从置信度最高的预测框开始，与其余预测框逐一计算
IOU
；如果某个预测框的
IOU
高于设定的
IOU
阈值，则将其删除，保留高质量的检测结果；对保留的预测框和真实框进行长宽比例差值的归一化处理得到：其中和表示真实框的宽度和高度，和表示预测框的高度与宽度
;
根据以上两式结果来计算权衡长宽比例差本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于
YOLOV5
融合多目标特征增强网络和注意力机制的交通小目标检测方法，其特征在于：包括以下步骤：步骤
1、
对图片进行预处理获得主要的特征数据；步骤
2、
将预处理的特征图送入主干网络中进行特征提取以及利用
CBAM
注意力机制对特征通道进行重组，赋予关键特征较大的权重来突出小目标的语义信息和细节特征；步骤
3、
经过主干网络重组后的特征图输入到特征增强网络中，通过优化多尺度特征重组模块，在原有基础上添加更适合小目标的检测头，使其能检测到
16
像素的小目标特征，对其中可能存在的目标进行候选框标定，同时利用深度可分离卷积代替特征增强网络中的普通卷积，以此来减少参数数量和加速模型推理速度提高感受野和特征表达能力；步骤
4、
经过特征增强网络处理的特征图送入目标检测网络中，根据位置损失函数的结果对候选框的位置进行修正，同时利用非极大值抑制算法抑制和删除多余候选框进而输出更精确的检测结果
。2.
根据权利要求1所述的一种基于
YOLOV5
融合多目标特征增强网络和注意力机制的交通小目标检测方法，其特征在于：步骤2中将输入的图片进行数据增强的预处理，处理后的图片送入深度神经网络进行训练，并输出训练后的模型，在主干网络中对输入的图片使用
Mosaic
数据增强算法，对图片进行随机翻转，平移，裁剪的方式将四张图片拼接成一张图片
。3.
根据权利要求2所述的一种基于
YOLOV5
融合多目标特征增强网络和注意力机制的交通小目标检测方法，其特征在于：将图片的特征图，输入主干网络中进行特征提取，使用一种
CBAM
注意力模块对特征图不同通道进行重组，赋予关键特征较大的权重来突出小目标的语义信息和细节特征，并降低不相关特征
。4.
根据权利要求3所述的一种基于
YOLOV5
融合多目标特征增强网络和注意力机制的交通小目标检测方法，其特征在于：利用全局平均池化的方式对特征图进行降维，其中
C
表示通道数，
H
表示高度，
W
表示宽度，得到通道的全局特征描述，具体的操作过程如下所示：其中
C
表示通道数，表示不同通道上的特征点信息；全连接网络层对获取的全局特征进行映射，学习到每个通道的重要性权重，将通道权重与原始特征图相乘，以调整通道特征的表示，增强重要通道的表征能力，具体的操作过程如下所示：其中，为
sigmoid
函数，，为表示利用平均池化和最大池化在空间上生成的特征映射，和表示两个多层感知机网络分别对最大池化和平均池化的结果进行融合处理；
经过通道维度上最大池化和平均池化的操作，得到两种不同的空间特征表示，使用一层卷积操作对两种空间特征进行融合，通过学习卷积核的权重，捕捉不同位置之间的相关性，将学习到的空间权重与原始特征图相乘，得到经过空间注意力调整的特征图，强调重要区域的空间信息，以此来提高航拍图中小目标特征的权重，提升对小目标的全局感知，具体的操作过程如下所示：其中，为
sigmoid
函数，是卷积核尺寸为的卷积操作，表示一个
MLP
网络用于融合...

【专利技术属性】
技术研发人员：朱凤华，朱高峰，郑奎，李崇，
申请(专利权)人：中科领航智能科技苏州有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人