基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法技术

技术编号:37449138 阅读:12 留言:0更新日期:2023-05-06 09:21
本发明专利技术涉及一种基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法,属于深度学习目标检测领域,具体包括以下步骤:S1:对原始图像进行数据增强,采用自适应锚框计算预定义锚框,采用自适应图像缩放处理将图像缩放到同一尺寸,将处理后图像输入引入基于空间注意力的可选择卷积核网络的YOLOv5骨干网络中;S2:输入图像经过所述骨干网络进行多层特征提取得到不同层次特征;S3:使用BiFPN对不同层次特征进行跨层特征融合,得到多个融合特征;S4:在YOLOv5检测层增加一组小目标检测锚框,对多个融合特征进行小目标检测;S5:对改进后的网络模型进行训练,将数据集输入训练好的模型中对小目标进行检测。对小目标进行检测。对小目标进行检测。

【技术实现步骤摘要】
基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法


[0001]本专利技术属于深度学习目标检测领域,涉及一种基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法

技术介绍

[0002]随着深度学习的发展,深度学习在图像识别中的应用愈发广泛,基于深度学习的目标检测算法逐渐成为近年来图像领域的研究热点。小目标从相对尺寸与绝对尺寸两方面可定义为:在图像中面积占比小于0.1或者在各大数据集中,小于相对固定像素的目标即定义为小目标。
[0003]深度学习对于大、中型目标的识别和检测在精度和准确度都表现优越,但由于小目标在图像中所占像素较低,可视化信息少,再加上小目标极易受到环境因素影响,导致小目标的识别和检测效率和精度远不如大、中型目标。
[0004]目前小目标检测模型的泛化能力弱,检测效果差强人意。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种基于空间注意力的可选择卷积核网络和加权双向特征金字塔的小目标检测方法,用于提高基于深度学习的小目标检测的精度。
[0006]为达到上述目的,本专利技术提供如下技术方案:
[0007]一种基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法,具体包括以下步骤:
[0008]S1:对原始图像进行数据增强,采用自适应锚框计算预定义锚框,采用自适应图像缩放处理将图像缩放到同一尺寸,将处理后图像输入引入基于空间注意力的可选择卷积核网络的YOLOv5骨干网络中;
[0009]S2:输入图像经过所述骨干网络进行多层特征提取得到不同层次特征;
[0010]S3:使用加权双向特征金字塔网络BiFPN对不同层次特征进行跨层特征融合,得到多个融合特征;
[0011]S4:在YOLOv5检测层增加一组小目标检测锚框,对多个融合特征进行小目标检测;
[0012]S5:对改进后的网络模型进行训练,将数据集输入训练好的模型中对小目标进行检测。
[0013]进一步,步骤S1中所述数据增强具体包括:对原始图像做Mosaic数据增强,将四张图片进行随机裁剪、缩放后,再随机排列拼接形成一张图片,实现丰富数据集的同时,增加了小样本目标,提升网络的训练速度。
[0014]进一步,步骤S1中所述采用自适应锚框计算预定义锚框具体为:在初始锚框的基础上,将输出预测框与真实框进行比对,计算差距后再反向更新,不断迭代参数来获取最合适的锚框值。其中采用k

means聚类和遗传学习算法对数据集进行分析,获得适合数据集中
对象边界框预测的预设锚定框。
[0015]进一步,步骤S1中所述引入基于空间注意力的可选择卷积核网络的YOLOv5骨干网络为:在可选择卷积核网络SKNet中融入空间注意力机制Coordinate Attention,得到将基于空间注意力的可选择卷积核网络CA

SKNet,再将CA

SKNet融入到C3卷积模块中,得到改进的YOLOv5骨干网络。
[0016]进一步,在所述引入基于空间注意力的可选择卷积核网络的YOLOv5骨干网络中:
[0017]空间注意力机制对输入特征沿两个空间方向聚合特征,得到一对方向感知特征图,大小分别为C
×
H
×
1和C
×1×
W;
[0018][0019][0020]其中,C代表通道数,H为输入图像高度,W为输入图像宽度,x
c
(h,i)代表特征图C
×
W
×
H中坐标为(h,i)的值,x
c
(j,w)代表特征图C
×
W
×
H中坐标为(j,w)的值,Z
ch
代表在W方向做平均池化结果,Z
cw
代表在H方向做平均池化结果;
[0021]两个大小分别为C
×
H
×
1和C
×1×
W的特征图拼接后经过卷积和归一化得到大小为的特征,后经过sigmoid激活函数将特征值放缩到(0,1)之间得到两个方向的权值;
[0022]f=δ(F1([z
h
,z
w
]))
[0023]g
h
=σ(F
h
(f
h
))
[0024]g
w
=σ(F
w
(f
w
))
[0025]其中,δ代表非线性变换,F代表卷积操作,z
h
表示在W方向做平均池化结果,σ代表激活函数,z
w
表示在H方向做平均池化结果,F
h
表示对f
h
做卷积处理,F
w
表示对f
w
做卷积处理,f代表经过卷积和非线性变换后的结果,f
h
表示z
h
经过卷积和非线性变换后的结果,f
w
表示z
w
经过卷积和非线性变换后的结果,g代表经过激活函数得到的权值,g
h
表示f
h
经过卷积F
h
和激活函数得到的权值,g
w
表示f
w
经过卷积F
w
和激活函数得到的权值;
[0026]原始特征图加权计算得到宽度和高度方向带有注意力权重的特征图:
[0027][0028]x
c
(i,j)代表原始特征图C
×
W
×
H中坐标为(i,j)的值,代表代表f
h
经过卷积和激活函数得到的权值,代表f
w
经过激活函数得到的权值,y
c
(i,j)代表原始特征图和高度方向权重和宽度方向权重相乘后得到新特征图。
[0029]进一步,步骤S3中所述使用加权双向特征金字塔网络BiFPN对不同层次特征进行跨层特征融合,具体包括:
[0030]经骨干网络特征提取后共有四层特征,分别位于第二层、第四层、第六层和第九层;
[0031]第九层特征经过一次自下而上的上采样过程,并与骨干网络输出四层特征进行融合,在第十层、第十四层、第十八层、第二十层分别输出一个特征图;
[0032]第二十层特征图再经过一次自上而下的下采样过程,并与骨干网络输出四层,以及前一个上采样输出四层特征融合,在第二十一层、第二十四层、第二十七层、第三十层分别输出一个特征送入检测层进行检测。
[0033]进一步,步骤S4中,在YOLOv5中增加一组小目标检测层,获取加权双向特征金字塔网络BiFPN输出的特征图后送入检测层进行小目标检测,增加小目标检测的精度。
[0034]进一步,所述小目标检测层为:由四层检测层组成,不同尺寸的特征图用于检测不同尺寸的目标对象,分别检测加权双向特征金字塔网本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法,其特征在于:具体包括以下步骤:S1:对原始图像进行数据增强,采用自适应锚框计算预定义锚框,采用自适应图像缩放处理将图像缩放到同一尺寸,将处理后图像输入引入基于空间注意力的可选择卷积核网络的YOLOv5骨干网络中;S2:输入图像经过所述骨干网络进行多层特征提取得到不同层次特征;S3:使用加权双向特征金字塔网络BiFPN对不同层次特征进行跨层特征融合,得到多个融合特征;S4:在YOLOv5检测层增加一组小目标检测锚框,对多个融合特征进行小目标检测;S5:对改进后的网络模型进行训练,将数据集输入训练好的模型中对小目标进行检测。2.根据权利要求1所述的基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法,其特征在于:步骤S1中所述数据增强具体包括:对原始图像做Mosaic数据增强,将四张图片进行随机裁剪、缩放后,再随机排列拼接形成一张图片。3.根据权利要求1所述的基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法,其特征在于:步骤S1中所述采用自适应锚框计算预定义锚框具体为:在初始锚框的基础上,将输出预测框与真实框进行比对,计算差距后再反向更新,不断迭代参数来获取最合适的锚框值;采用k

means聚类和遗传学习算法对数据集进行分析,获得适合数据集中对象边界框预测的预设锚定框。4.根据权利要求1所述的基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法,其特征在于:步骤S1中所述引入基于空间注意力的可选择卷积核网络的YOLOv5骨干网络为:在可选择卷积核网络SKNet中融入空间注意力机制Coordinate Attention,得到将基于空间注意力的可选择卷积核网络CA

SKNet,再将CA

SKNet融入到C3卷积模块中,得到改进的YOLOv5骨干网络。5.根据权利要求1所述的基于可选择卷积核网络及加权双向特征金字塔的小目标检测方法,其特征在于:在所述引入基于空间注意力的可选择卷积核网络的YOLOv5骨干网络中:空间注意力机制对输入特征沿两个空间方向聚合特征,得到一对方向感知特征图,大小分别为C
×
H
×
1和C
×1×
W;W;其中,C代表通道数,H为输入图像高度,W为输入图像宽度,x
c
(h,i)代表特征图C
×
W
×
H中坐标为(h,i)的值,x
c
(j,w)代表特征图C
×
W
×
H中坐标为(j,w)的值,代表在W方向做平均池化结果,代表在H方向做平均池化结果;两个大小分别为C
×
H
×
1和C
×1×
W的特征图拼接后经过卷积和归一化得到大小为的特征,后经过sigmoid激活函数将特征值放缩到(0,1)之间得到两个方向的权值;
f=δ(F1([z
h
,z
w
]))g
h
=σ(F
h
(f
h
))g
w
=σ(F
w
(f
w
))其中,δ代表非线性变换,F代表卷积操作,z
h
表示在W方向做平均池化结果,σ代表激活函数,z
w
表示在H方向做平均...

【专利技术属性】
技术研发人员:万久地潘纯洁张前进罗正岳蒋波
申请(专利权)人:中国铁塔股份有限公司重庆市分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1