当前位置: 首页 > 专利查询>江苏大学专利>正文

一种基于YOLOv5s的密集目标检测方法技术

技术编号:35275031 阅读:14 留言:0更新日期:2022-10-19 10:53
本发明专利技术涉及一种基于YOLOv5s的密集目标检测方法。在CSP模块不同支路中分别加入空间注意力机制和通道注意力机制;在Backbone中使用RepVGG Block模块,以提高不同尺度目标的识别精度,提升推理速度;添加SA注意力模块,提升算法的特征提取能力;在Neck中使用CARAFE上采样,获得更大的感受野;引入Varifocal Loss损失函数,在密集目标样本训练中更加关注高质量的正样本。本发明专利技术采用鱼类作为数据集进行训练,并将训练好的模型权重用于检测,有效减少了人力和物力的消耗,提高了检测准确率,能够较好的满足密集目标检测任务的需求。较好的满足密集目标检测任务的需求。较好的满足密集目标检测任务的需求。

【技术实现步骤摘要】
一种基于YOLOv5s的密集目标检测方法


[0001]本专利技术涉及计算机视觉目标检测领域,具体涉及一种基于YOLOv5s的密集目标检测方法。

技术介绍

[0002]视觉目标检测旨在定位和识别图像中存在的物体,属于计算机视觉领域的经典任务之一,也是许多计算机视觉任务的前提与基础,在自动驾驶、视频监控、水产养殖、智慧农业等领域具有重要的理论研究意义和实际应用价值。随着深度学习技术的飞速发展,目标检测取得了巨大的进展。以往的人工检测方式准确率差,效率低,耗时耗力。随着图像处理技术的不断发展,传统的机器学习通过支持向量机,进行分类识别,该方法检测结果准确率不高,且容易造成漏检误检等情况。近年来,对于诸多领域内存在密集目标的情况,采用计算机视觉技术结合深度学习方法进行检测逐渐成为主流,目标检测识别算法它通过卷积神经网络来自动提取目标特征,相较于以往的方法,具有更快的检测速度和更高的检测准确率。

技术实现思路

[0003]针对上述存在的问题,提出一种基于YOLOv5s的密集目标检测模型。采用该模型能够较好的满足密集目标检测检测任务的需求。
[0004]为了实现上述目的,本专利技术采用的技术方案如下:一种基于YOLOv5s的密集目标检测方法,包括如下步骤:
[0005]1)将检测装置置于投饵船前端检测鱼群数量情况,所述检测装置包括摄像装置和照明装置;所述摄像装置用于拍摄鱼群进行数量检测;所述照明装置保持常亮用于水下照明;
[0006]2)构建鱼类数据集D2,划分训练集D
train
和验证集D
test

[0007]3)构建YOLOv5s网络模型,所述YOLOv5s网络模型包括Input、Backbone、Neck、Prediction;所述Input包括Mosaic数据增强、自适应锚框计算、自适应图片缩放;所述Backbone包括Focus模块、SPP模块和C3模块;所述颈部网络Neck包括FPN模块、PAN模块、C3模块;所述Prediction包括Bounding box损失函数和NMS;
[0008]4)修改主干网络卷积模块,将主干网络卷积模块修改为RepVGG Block模块;
[0009]5)修改主干网络结构,在RepVGG模块与SPP模块之间插入SA注意力机制;
[0010]6)修改YOLOv5s颈部网络的上采样方式,将最邻近上采样改为CARAFE上采样方式;
[0011]7)将评价目标框和预测框的类损失和置信度损失的损失函数Focal Loss修改为Varifocal Loss损失函数;
[0012]8)对鱼类数据集D2进行迁移训练,得到训练权重w;即用GIOU_Loss作为损失函数,当模型损失曲线趋近于0且无明显波动时,停止训练,得到训练权重w,否则继续训练;
[0013]9)输入图像,进行鱼群检测,将获取到的鱼群图像输入到训练权重为w的模型中,
模型根据权重自动识别鱼群数量。
[0014]进一步地,上述步骤2)包括如下步骤:
[0015]2.1)从鱼类公共数据集选取N张,构建数据集D1;
[0016]2.2)使用标注工具Labelimg对数据集D1中每一张图像中的鱼类进行标注,构建鱼类数据集D2;
[0017]2.3)按照比例将鱼类数据集D2划分为训练集D
train
和验证集D
test

[0018]进一步地,上述步骤4)包括如下步骤:
[0019]4.1)训练多分支模型:在训练时,为每一个3
×
3卷积层添加平行的1
×
1卷积分支与恒等映射分支;
[0020]4.2)将多分支模型等价转换为单路模型:将1
×
1卷积看成卷积核中有很多0的3
×
3卷积,恒等映射是一个特殊1
×
1卷积;根据卷积的可加性原理,每个RepVGG Block模块三个分支则可以合并为一个3
×
3卷积;
[0021]4.3)结构参数重构:通过实际数据流,将多分支网络的权值转移到简单网络中。
[0022]进一步地,上述步骤5)包括如下步骤:
[0023]5.1)特征分组:假设输入特征为X∈R
C
×
H
×
W
,其中C、H、W分别表示通道数、高度和宽度,特征分组会将输入X沿着通道维度拆分为g组,使得每个子功能在训练过程中逐渐捕获特定的语义响应;
[0024]5.2)使用通道注意力机制,捕获通道相关性信息,计算公式如下:
[0025][0026]X

k1
=σ(W1s+b1)
·
X
k1
[0027]式中:s表示信道统计,X
k1
为在通道维度被分成的一个分支,X

k1
表示通道注意力的最终输出,σ为sigmoid激活函数,W1与b1是形状为C/2G
×1×
1的参数。
[0028]5.3)使用空间注意力机制,捕获空间相关性信息,计算公式见下:
[0029]X

k2
=σ(W2·
GN(X
K2
)+b2)
·
X
k2
[0030]式中:X
k2
为在通道维度被分成的一个分支,X

k2
表示空间注意力的最终输出,W2与b2是形状为C/2G
×1×
1的参数,GN表示组归一化方法;
[0031]5.4)聚合:在完成通道注意力、空间注意力计算后,对两种注意力进行集成,通过Concat进行融合得到:X

k
=[X

k1
,X

k2
]∈R
C/2G
×
H
×
W
,采用通道置换操作(channel shuffle)进行组间通信。
[0032]进一步地,上述步骤6)中,包括如下步骤:
[0033]6.1)特征图通道压缩:假设上采样倍率为σ,对于形状为C
×
H
×
W的输入特征图,其中C、H、W分别表示通道数、高度和宽度,用1
×
1卷积将它的通道数压缩到C
m

[0034]6.2)内容编码及上采样核预测:对步骤6.1)压缩后的输入特征图,利用的卷积层预测上采样核,假设上采样的卷积核为k
up
×
k
up
,输入通道数为C
m
,输出通道数为将通道维在空间维展开,得到形状为的上采样核;
[0035]6.3)上采样核归一化:对步骤6.2)得到的上采样核每个通道k
up
×
k本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于YOLOv5s的密集目标检测方法,其特征在于,包括如下步骤:1)将检测装置置于投饵船前端检测鱼群数量情况,所述检测装置包括摄像装置和照明装置;所述摄像装置用于拍摄鱼群进行数量检测;所述照明装置保持常亮用于水下照明;2)构建鱼类数据集D2,划分训练集D
train
和验证集D
test
;3)构建YOLOv5s网络模型,所述YOLOv5s网络模型包括Input、Backbone、Neck、Prediction;所述Input包括Mosaic数据增强、自适应锚框计算、自适应图片缩放;所述Backbone包括Focus模块、SPP模块和C3模块;所述颈部网络Neck包括FPN模块、PAN模块、C3模块;所述Prediction包括Bounding box损失函数和NMS;4)修改主干网络卷积模块,将主干网络卷积模块修改为RepVGG Block模块;5)修改主干网络结构,在RepVGG模块与SPP模块之间插入SA注意力机制;6)修改YOLOv5s颈部网络的上采样方式,将最邻近上采样改为CARAFE上采样方式;7)将评价目标框和预测框的类损失和置信度损失的损失函数Focal Loss修改为Varifocal Loss损失函数;8)对鱼类数据集D2进行迁移训练,得到训练权重w;即用GIOU_Loss作为损失函数,当模型损失曲线趋近于0且无明显波动时,停止训练,得到训练权重w,否则继续训练;9)输入图像,进行鱼群检测,将获取到的鱼群图像输入到训练权重为w的模型中,模型根据权重自动识别鱼群数量。2.如权利要求1所述的基于YOLOv5s的密集目标检测方法,其特征在于所述步骤2)包括如下步骤:2.1)从鱼类公共数据集选取N张,构建数据集D1;2.2)使用标注工具Labelimg对数据集D1中每一张图像中的鱼类进行标注,构建鱼类数据集D2;2.3)按照比例将鱼类数据集D2划分为训练集D
train
和验证集D
test
。3.如权利要求1所述的基于YOLOv5s的密集目标检测方法,其特征在于所述步骤4)包括如下步骤:4.1)训练多分支模型:在训练时,为每一个3
×
3卷积层添加平行的1
×
1卷积分支与恒等映射分支;4.2)将多分支模型等价转换为单路模型:将1
×
1卷积看成卷积核中有很多0的3
×
3卷积,恒等映射是一个特殊1
×
1卷积;根据卷积的可加性原理,每个RepVGG Block模块三个分支则可以合并为一个3
×
3卷积;4.3)结构参数重构:通过实际数据流,将多分支网络的权值转移到简单网络中。4.如权利要求1所述的基于YOLOv5s的密集目标检测方法,其特征在于,所述步骤5)包括如下步骤:5.1)特征分组:假设输入特征为X∈R
C
×
H
×
W
,其中C、H、W分别表示通道数、高度和宽度,特征分组会将输入X沿着通道维度拆分为g组,使得每个子功能在训练过程中逐渐捕获特定的语义响应;5.2)使用通道注意力机制,捕获通道相关性信息,计算公式如下:
X
k
′1=σ(W1s+b1)
·
X
k...

【专利技术属性】
技术研发人员:宋雪桦顾寅武张舜尧王昌达金华袁昕
申请(专利权)人:江苏大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1