一种基于改进YOLOV5的水面目标检测算法制造技术

技术编号:39131678 阅读:8 留言:0更新日期:2023-10-23 14:51
本发明专利技术公开了一种基于改进YOLOV5的水面目标检测算法,其涉及水上清理识别算法技术领域,旨在解决清洁无人船无法对相应的垃圾进行处理,降低了整体清洁效果的问题,其技术方案要点是,其算法如下:S1:水面目标数据集的制作;S2:YOLOV5网络结构:YOLO系列的网络模型在得到输入图像后,会直接在输出图像的多个位置进行回归,输出多个对象的边界框和分类类别,直接使用整个图像来训练网络模型;S3:优化设计:针对YOLO网络缺乏小目标检测的问题,增加小目标优化检测方法;S4:实验结果:在目标检测中,通常根据计算检测框与真实框的IOU去判别检测框是否检测准确。达到准确识别、提高小目标检测精准度和增加清洁效果和效率的效果。标检测精准度和增加清洁效果和效率的效果。

【技术实现步骤摘要】
一种基于改进YOLO V5的水面目标检测算法


[0001]本专利技术涉及水上清理识别算法
,尤其是涉及一种基于改进YOLO V5的水面目标检测算法。

技术介绍

[0002]随着经济的不断发展和人口的不断增多,水库、江河、湖泊、近海水体的树木枝叶、庄稼杂草、塑料泡沫、生活垃圾等漂浮物的数量越来越多;由于受主客观因素的影响,水面常常带有各类漂浮物,且水面漂浮物逐年不断增多,给水库、电站以及各种水上设施和饮用水的安全带来隐患,人们都在争取采用各种方式打捞漂浮物。
[0003]目前,大多通过清洁无人船巡检对水面上的垃圾进行识别并进行拾取和处理,面垃圾进行清理,从而需要无人艇对其进行清理,使其维护生态环境,清洁无人船巡检时需要对水面垃圾进行充分识别。
[0004]但是目前不存在上述水上垃圾识别算法,导致清洁无人船无法对相应的垃圾进行处理,但是目标检测的精度与效率会直接影响无人船的巡检与清洁的工作任务的完成情况,降低了整体的清洁效果。

技术实现思路

[0005]本专利技术的目的是提供一种对水上垃圾进行充分识别的基于改进YOLO V5的水面目标检测算法。
[0006]为实现上述目的,本专利技术提供了如下技术方案:
[0007]一种基于改进YOLO V5的水面目标检测算法,其算法如下:
[0008]S1:水面目标数据集的制作:通过已有的开源数据集和实验过程中无人船使用主动采集的图片,以及互联网上其他的资源这三种途径制作数据集,并对数据集进行处理;
[0009]A1:水面图像处理,使用软件对图像中的目标物进行标注,同时去除高光和降噪处理,减少图像中的干扰元素;
[0010]A2:数据集增强:将镜像,翻转,裁剪,旋转,平移,模糊,加入噪声和调整亮度这几种常见的图像增强方法每次用三种变换随机组合,增加更多的样本数据支持;
[0011]S2:YOLO V5网络结构:YOLO系列的网络模型在得到输入图像后,会直接在输出图像的多个位置进行回归,输出多个对象的边界框和分类类别,直接使用整个图像来训练网络模型;
[0012]B1:网络结构:YOLO V5的网络结构是一种单阶段目标检测网络结构,根据模型的大小和网络复杂程度有4个公开版本,分别是:YOLO V5s、YOLO V5m、YOLO V5l和YOLO V5x,每个版本都有输入端、Backbone、Neck和Prediction四个部分;
[0013]B2:模块组成:YOLO V5s的输入图像大小为608*608,且YOLO V5s网络重要组件有CBL模块、Focus模块、SPP模块和CSP模块;
[0014]S3:优化设计:针对YOLO网络缺乏小目标检测的问题,增加小目标优化检测方法,
将TPH

YOLO V5算法用于水面小目标检测,在YOLO V5的head部分,即在操作层第17层后,继续对特征图进行上采样,以增加特征图的大小,同时,在第20层,将160*160大小的特征映射与骨干网络中第2层的特征图融合,以获得更大的特征图用于小目标检测,并将原始版本的YOLO V5中的head部分和骨干网络末端的几个C3结构替换为Transformer的encoder模块,形成Transformer Prediction Heads,Transformer的编码器的结构包括两个主要模块,一个多头注意模块和一个前馈神经网络,编码器中还设置有用于助于网络更好地融合,防止网络过度拟合的LayerNorm层和Dropout层,并在head部分中加入用于增加网络在小目标检测准确率的CBAM模块;
[0015]S4:实验结果:在目标检测中,通常根据计算检测框与真实框的IOU去判别检测框是否检测准确,当检测帧和真实帧的IOU大于阈值时,就被判定为匹配,如果两个检测框对应的类别是相同的,就被认为检测正确,当IOU大于阈值但类别不正确时,判定为错误检测,即使检测框的类别与真实类别匹配时,但如果IOU小于阈值,也被判断为是对背景的误检,最后,当目标上没有检测框时,定义为漏检,由以上几个参数,可以构成混淆矩阵,并根据混淆矩阵的结果进行分析,获得最终数据。
[0016]进一步的,所述S2中输入端由Mosaic数据增强、自适应锚框计算、自适应图片缩放三个功能模块组成,用于对输入的图片进行处理。
[0017]进一步的,所述S2中Backbone结构主要由Focus和CSP两个部分组成,其中,Focus是YOLO V5的原创性结构。
[0018]进一步的,所述S2中Neck层是将FPN和PAN技术有机结合的网络架构,用于有效地将Backbone层和输出层之间的融合特征提取出来。
[0019]进一步的,所述S2中Prediction采用的Bounding box的损失函数为CIOU_Loss,用于解决目标框回归函数存在的问题。
[0020]进一步的,所述B2中CBL模块、Focus模块、SPP模块和CSP模块作用如下:
[0021]Focus模块:用于对图像的每隔一个像素取一个值,获得四组图像,并将图片的长宽信息集中到一个通道空间中,使得通道维度的大小增加到原来的四倍,从而将RGB3通道模式改变为十二个通道;
[0022]CBL模块:该模块由Conv、BN和Leaky

Relu三部分组成;
[0023]SPP模块:用于将CBL模块的输出分别输入到1*1、5*5、9*9和13*13的Max pool层,再将输出结果进行连接,获取得到融合特征;
[0024]CSP模块::CSPNet模块由卷积层、CBL模块和Res Unit模块三部分组成,其中,Res Unit模块借鉴ResNet残差结构,由CBL模块组成。
[0025]进一步的,所述S3中Transformer网络模型采用编码器

解码器(Encoer

Decoder)结构,在Transformer网络的编码器结构中,数据会首先经过自注意力结构得到特征向量X,计算公式如下:
[0026][0027]之后,特征向量X将被送到前馈神经网络,这个网络第一层是Relu激活函数,第二层是一个线性激活函数,可以表示为:
[0028]FFN(X)=max(0,XW1+b1)W2+b2;
[0029]进一步的,所述S4中混淆矩阵能够定义精确率和召回率的计算公式:
[0030][0031][0032]将阈值从1降低到0时,混淆矩阵的参数值就会发生变化,再分别以准确率和召回率作为横坐标和纵坐标绘制曲线,这个曲线就叫做P

R曲线,P

R曲线和两个坐标轴所包围的面积即为平均精度(AP),对于整个数据集,使用平均精度mAP来检测模型的检测结果,计算如下:
[0033][0034]其中C表示数据集总类别数。
[0035]同时,为了更好地评估给定模型的精度和查全率值,并得到目标检测模型的最佳置信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLO V5的水面目标检测算法,其特征在于:其算法如下:S1:水面目标数据集的制作:通过已有的开源数据集和实验过程中无人船使用主动采集的图片,以及互联网上其他的资源这三种途径制作数据集,并对数据集进行处理;A1:水面图像处理,使用软件对图像中的目标物进行标注,同时去除高光和降噪处理,减少图像中的干扰元素;A2:数据集增强:将镜像,翻转,裁剪,旋转,平移,模糊,加入噪声和调整亮度这几种常见的图像增强方法每次用三种变换随机组合,增加更多的样本数据支持;S2:YOLO V5网络结构:YOLO系列的网络模型在得到输入图像后,会直接在输出图像的多个位置进行回归,输出多个对象的边界框和分类类别,直接使用整个图像来训练网络模型;B1:网络结构:YOLO V5的网络结构是一种单阶段目标检测网络结构,根据模型的大小和网络复杂程度有4个公开版本,分别是:YOLO V5s、YOLO V5m、YOLO V5l和YOLO V5x,每个版本都有输入端、Backbone、Neck和Prediction四个部分;B2:模块组成:YOLO V5s的输入图像大小为608*608,且YOLO V5s网络重要组件有CBL模块、Focus模块、SPP模块和CSP模块;S3:优化设计:针对YOLO网络缺乏小目标检测的问题,增加小目标优化检测方法,将TPH

YOLO V5算法用于水面小目标检测,在YOLO V5的head部分,即在操作层第17层后,继续对特征图进行上采样,以增加特征图的大小,同时,在第20层,将160*160大小的特征映射与骨干网络中第2层的特征图融合,以获得更大的特征图用于小目标检测,并将原始版本的YOLO V5中的head部分和骨干网络末端的几个C3结构替换为Transformer的encoder模块,形成Transformer Prediction Heads,Transformer的编码器的结构包括两个主要模块,一个多头注意模块和一个前馈神经网络,编码器中还设置有用于助于网络更好地融合,防止网络过度拟合的LayerNorm层和Dropout层,并在head部分中加入用于增加网络在小目标检测准确率的CBAM模块;S4:实验结果:在目标检测中,通常根据计算检测框与真实框的IOU去判别检测框是否检测准确,当检测帧和真实帧的IOU大于阈值时,就被判定为匹配,如果两个检测框对应的类别是相同的,就被认为检测正确,当IOU大于阈值但类别不正确时,判定为错误检测,即使检测框的类别与真实类别匹配时,但如果IOU小于阈值,也被判断为是对背景的误检,最后,当目标上没有检测框时,定义为漏检,由以上几个参数,可以构成混淆矩阵,并根据混淆矩阵的结果进行分析,获得最终数据。2.根据权利要求1所述的一种基于改进YOLO V5的水面目标检测算法,其特征在于:所述S2中输入端由Mosaic数据增强、自适应锚框计算、自适应图片缩放三个功能模块组成,用于对输入的图片进行处理。3.根据权利要求1所述的一种基于改进YOLO...

【专利技术属性】
技术研发人员:马磊李立崑王建宇程霁月何新黄成文渊
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1