基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法技术

技术编号：37449138 阅读：12 留言：0更新日期：2023-05-06 09:21

本发明专利技术涉及一种基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法，属于深度学习目标检测领域，具体包括以下步骤：S1：对原始图像进行数据增强，采用自适应锚框计算预定义锚框，采用自适应图像缩放处理将图像缩放到同一尺寸，将处理后图像输入引入基于空间注意力的可选择卷积核网络的YOLOv5骨干网络中；S2：输入图像经过所述骨干网络进行多层特征提取得到不同层次特征；S3：使用BiFPN对不同层次特征进行跨层特征融合，得到多个融合特征；S4：在YOLOv5检测层增加一组小目标检测锚框，对多个融合特征进行小目标检测；S5：对改进后的网络模型进行训练，将数据集输入训练好的模型中对小目标进行检测。对小目标进行检测。对小目标进行检测。

全部详细技术资料下载

【技术实现步骤摘要】
基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法

[0001]本专利技术属于深度学习目标检测领域，涉及一种基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法

技术介绍

[0002]随着深度学习的发展，深度学习在图像识别中的应用愈发广泛，基于深度学习的目标检测算法逐渐成为近年来图像领域的研究热点。小目标从相对尺寸与绝对尺寸两方面可定义为：在图像中面积占比小于0.1或者在各大数据集中，小于相对固定像素的目标即定义为小目标。
[0003]深度学习对于大、中型目标的识别和检测在精度和准确度都表现优越，但由于小目标在图像中所占像素较低，可视化信息少，再加上小目标极易受到环境因素影响，导致小目标的识别和检测效率和精度远不如大、中型目标。
[0004]目前小目标检测模型的泛化能力弱，检测效果差强人意。

技术实现思路

[0005]有鉴于此，本专利技术的目的在于提供一种基于空间注意力的可选择卷积核网络和加权双向特征金字塔的小目标检测方法，用于提高基于深度学习的小目标检测的精度。
[0006]为达到上述目的，本专利技术提供如下技术方案：
[0007]一种基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法，具体包括以下步骤：
[0008]S1：对原始图像进行数据增强，采用自适应锚框计算预定义锚框，采用自适应图像缩放处理将图像缩放到同一尺寸，将处理后图像输入引入基于空间注意力的可选择卷积核网络的YOLOv5骨干网络中；
[0009]S2：输入图像经过所述骨干...

【技术保护点】

【技术特征摘要】
1.一种基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法，其特征在于：具体包括以下步骤：S1：对原始图像进行数据增强，采用自适应锚框计算预定义锚框，采用自适应图像缩放处理将图像缩放到同一尺寸，将处理后图像输入引入基于空间注意力的可选择卷积核网络的YOLOv5骨干网络中；S2：输入图像经过所述骨干网络进行多层特征提取得到不同层次特征；S3：使用加权双向特征金字塔网络BiFPN对不同层次特征进行跨层特征融合，得到多个融合特征；S4：在YOLOv5检测层增加一组小目标检测锚框，对多个融合特征进行小目标检测；S5：对改进后的网络模型进行训练，将数据集输入训练好的模型中对小目标进行检测。2.根据权利要求1所述的基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法，其特征在于：步骤S1中所述数据增强具体包括：对原始图像做Mosaic数据增强，将四张图片进行随机裁剪、缩放后，再随机排列拼接形成一张图片。3.根据权利要求1所述的基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法，其特征在于：步骤S1中所述采用自适应锚框计算预定义锚框具体为：在初始锚框的基础上，将输出预测框与真实框进行比对，计算差距后再反向更新，不断迭代参数来获取最合适的锚框值；采用k
‑
means聚类和遗传学习算法对数据集进行分析，获得适合数据集中对象边界框预测的预设锚定框。4.根据权利要求1所述的基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法，其特征在于：步骤S1中所述引入基于空间注意力的可选择卷积核网络的YOLOv5骨干网络为：在可选择卷积核网络SKNet中融入空间注意力机制Coordinate Attention，得到将基于空间注意力的可选择卷积核网络CA
‑
SKNet，再将CA
‑
SKNet融入到C3卷积模块中，得到改进的YOLOv5骨干网络。5.根据权利要求1所述的基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法，其特征在于：在所述引入基于空间注意力的可选择卷积核网络的YOLOv5骨干网络中：空间注意力机制对输入特征沿两个空间方向聚合特征，得到一对方向感知特征图，大小分别为C
×
H
×
1和C
×1×
W；W；其中，C代表通道数，H为输入图像高度，W为输入图像宽度，x
c
(h,i)代表特征图C
×
W
×
H中坐标为(h,i)的值，x
c
(j,w)代表特征图C
×
W
×
H中坐标为(j,w)的值，代表在W方向做平均池化结果，代表在H方向做平均池化结果；两个大小分别为C
×
H
×
1和C
×1×
W的特征图拼接后经过卷积和归一化得到大小为的特征，后经过sigmoid激活函数将特征值放缩到(0,1)之间得到两个方向的权值；
f＝δ(F1([z
h
,z
w
]))g
h
＝σ(F
h
(f
h
))g
w
＝σ(F
w
(f
w
))其中，δ代表非线性变换，F代表卷积操作，z
h
表示在W方向做平均池化结果，σ代表激活函数，z
w
表示在H方向做平均...

【专利技术属性】
技术研发人员：万久地，潘纯洁，张前进，罗正岳，蒋波，
申请(专利权)人：中国铁塔股份有限公司重庆市分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人