一种基于YOLOv5s的密集目标检测方法技术

技术编号：35275031 阅读：14 留言：0更新日期：2022-10-19 10:53

本发明专利技术涉及一种基于YOLOv5s的密集目标检测方法。在CSP模块不同支路中分别加入空间注意力机制和通道注意力机制；在Backbone中使用RepVGG Block模块，以提高不同尺度目标的识别精度，提升推理速度；添加SA注意力模块，提升算法的特征提取能力；在Neck中使用CARAFE上采样，获得更大的感受野；引入Varifocal Loss损失函数，在密集目标样本训练中更加关注高质量的正样本。本发明专利技术采用鱼类作为数据集进行训练，并将训练好的模型权重用于检测，有效减少了人力和物力的消耗，提高了检测准确率，能够较好的满足密集目标检测任务的需求。较好的满足密集目标检测任务的需求。较好的满足密集目标检测任务的需求。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于YOLOv5s的密集目标检测方法

[0001]本专利技术涉及计算机视觉目标检测领域，具体涉及一种基于YOLOv5s的密集目标检测方法。

技术介绍

[0002]视觉目标检测旨在定位和识别图像中存在的物体,属于计算机视觉领域的经典任务之一,也是许多计算机视觉任务的前提与基础,在自动驾驶、视频监控、水产养殖、智慧农业等领域具有重要的理论研究意义和实际应用价值。随着深度学习技术的飞速发展,目标检测取得了巨大的进展。以往的人工检测方式准确率差，效率低，耗时耗力。随着图像处理技术的不断发展，传统的机器学习通过支持向量机，进行分类识别，该方法检测结果准确率不高，且容易造成漏检误检等情况。近年来，对于诸多领域内存在密集目标的情况，采用计算机视觉技术结合深度学习方法进行检测逐渐成为主流，目标检测识别算法它通过卷积神经网络来自动提取目标特征，相较于以往的方法，具有更快的检测速度和更高的检测准确率。

技术实现思路

[0003]针对上述存在的问题，提出一种基于YOLOv5s的密集目标检测模型。采用该模型能够较好的满足密集目标检测检测任务的需求。
[0004]为了实现上述目的，本专利技术采用的技术方案如下：一种基于YOLOv5s的密集目标检测方法，包括如下步骤：
[0005]1)将检测装置置于投饵船前端检测鱼群数量情况，所述检测装置包括摄像装置和照明装置；所述摄像装置用于拍摄鱼群进行数量检测；所述照明装置保持常亮用于水下照明；
[0006]2)构建鱼类数据集D2，划分训练集D
train...

【技术保护点】

【技术特征摘要】
1.一种基于YOLOv5s的密集目标检测方法，其特征在于，包括如下步骤：1)将检测装置置于投饵船前端检测鱼群数量情况，所述检测装置包括摄像装置和照明装置；所述摄像装置用于拍摄鱼群进行数量检测；所述照明装置保持常亮用于水下照明；2)构建鱼类数据集D2，划分训练集D
train
和验证集D
test
；3)构建YOLOv5s网络模型，所述YOLOv5s网络模型包括Input、Backbone、Neck、Prediction；所述Input包括Mosaic数据增强、自适应锚框计算、自适应图片缩放；所述Backbone包括Focus模块、SPP模块和C3模块；所述颈部网络Neck包括FPN模块、PAN模块、C3模块；所述Prediction包括Bounding box损失函数和NMS；4)修改主干网络卷积模块，将主干网络卷积模块修改为RepVGG Block模块；5)修改主干网络结构，在RepVGG模块与SPP模块之间插入SA注意力机制；6)修改YOLOv5s颈部网络的上采样方式，将最邻近上采样改为CARAFE上采样方式；7)将评价目标框和预测框的类损失和置信度损失的损失函数Focal Loss修改为Varifocal Loss损失函数；8)对鱼类数据集D2进行迁移训练，得到训练权重w；即用GIOU_Loss作为损失函数，当模型损失曲线趋近于0且无明显波动时，停止训练，得到训练权重w，否则继续训练；9)输入图像，进行鱼群检测，将获取到的鱼群图像输入到训练权重为w的模型中，模型根据权重自动识别鱼群数量。2.如权利要求1所述的基于YOLOv5s的密集目标检测方法，其特征在于所述步骤2)包括如下步骤：2.1)从鱼类公共数据集选取N张，构建数据集D1；2.2)使用标注工具Labelimg对数据集D1中每一张图像中的鱼类进行标注，构建鱼类数据集D2；2.3)按照比例将鱼类数据集D2划分为训练集D
train
和验证集D
test
。3.如权利要求1所述的基于YOLOv5s的密集目标检测方法，其特征在于所述步骤4)包括如下步骤：4.1)训练多分支模型：在训练时，为每一个3
×
3卷积层添加平行的1
×
1卷积分支与恒等映射分支；4.2)将多分支模型等价转换为单路模型：将1
×
1卷积看成卷积核中有很多0的3
×
3卷积，恒等映射是一个特殊1
×
1卷积；根据卷积的可加性原理，每个RepVGG Block模块三个分支则可以合并为一个3
×
3卷积；4.3)结构参数重构：通过实际数据流，将多分支网络的权值转移到简单网络中。4.如权利要求1所述的基于YOLOv5s的密集目标检测方法，其特征在于，所述步骤5)包括如下步骤：5.1)特征分组：假设输入特征为X∈R
C
×
H
×
W
，其中C、H、W分别表示通道数、高度和宽度，特征分组会将输入X沿着通道维度拆分为g组，使得每个子功能在训练过程中逐渐捕获特定的语义响应；5.2)使用通道注意力机制，捕获通道相关性信息，计算公式如下：
X
k
′1＝σ(W1s+b1)
·
X
k...

【专利技术属性】
技术研发人员：宋雪桦，顾寅武，张舜尧，王昌达，金华，袁昕，
申请(专利权)人：江苏大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人