一种基于YOLOv5s网络结构的目标检测方法及其系统技术方案

技术编号:35261097 阅读:16 留言:0更新日期:2022-10-19 10:20
本发明专利技术涉及小目标检测领域,特别涉及一种基于YOLO v5s网络结构的目标检测方法及其系统;本发明专利技术先进行图片的马赛克数据增强处理、自适应锚框计算和图片尺寸处理,而且还对图片进行切片后池化再进行特征图融合,在采用YOLO v5s原有的按通道维度拼接方法的同时,采用双向特征金字塔网络的双向网络进行融合,提高了小目标的检测的精度的效果。小目标的检测的精度的效果。小目标的检测的精度的效果。

【技术实现步骤摘要】
一种基于YOLO v5s网络结构的目标检测方法及其系统


[0001]本专利技术涉及小目标检测领域,特别涉及一种基于YOLO v5s网络结构的目标检测方法及其系统。

技术介绍

[0002]随着计算机领域的迅速发展,目标检测这个计算机视觉中的重要组成部分也受到社会各界的广泛研究与探索,并且目标检测技术已经广泛应用于医学、交通、安防、互联网等领域,而小目标广泛存在于大视场图片、远距离成像图片、特殊类别目标图片中,并且小目标的图像具有信息少,信息占比低、特征不明显等因素;基于上述原因,提高小目标检测精度以及实时性成为了目标检测广泛应用背景下的当务之急。
[0003]大多数目标检测方法都是利用卷积神经网络进行特征提取,而卷积神经网络大多采用的是最顶端的高层特征,小目标固有的分辨率低,经过多次下采样后特征图持续不断减小,导致小目标的细节信息丢失严重。

技术实现思路

[0004]本专利技术主要解决的技术问题是提供一种基于YOLO v5s网络结构的目标检测方法,其对图片进行了马赛克数据增强处理、自适应锚框计算和图片尺寸处理,而且还对图片进行切片后池化再进行特征图融合,在采用YOLO v5s原有的按通道维度拼接方法的同时,采用双向特征金字塔网络的双向网络进行融合,提高了小目标的检测的精度的效果;还提供了一种基于YOLO v5s网络结构的目标检测系统。
[0005]为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种基于YOLO v5s网络结构的目标检测方法,其中,包括如下步骤:
[0006]步骤S1、采集输入图片,对图片进行马赛克数据增强处理,再进行自适应锚框计算得到最佳锚框值,再进行图片尺寸处理缩放到一个固定尺寸;
[0007]步骤S2、对图片进行切片操作处理,再进行32个卷积核的卷积操作,然后对图片的卷积层特征图进行池化处理,将不同尺寸的卷积层特征图拼接在一起;
[0008]步骤S3、采用双向特征金字塔网络将图片中不同辨率的特征进行融合形成多尺度特征融合,且将多尺度特征融合并入YOLO v5s网络结构内;
[0009]步骤S4、对融合特征后的图片进行检测,之后输出。
[0010]作为本专利技术的一种改进,在步骤S3内,将高分辨率的P2特征的信息引入多尺度特征融合中。
[0011]作为本专利技术的进一步改进,在步骤S4内,采用CIOU_Loss作为损失函数来进行检测区分每个目标框中预测框的相对位置。
[0012]作为本专利技术的更进一步改进,在步骤S1内,对将图片中数据集取出batch,再从中随机取出4张图片,进行随机位置裁剪拼接成新图,循环进行后进行马赛克数据增强处理。
[0013]作为本专利技术的进一步改进,在步骤S1内,在不同的数据集中设定不同初始长宽的
锚框,在训练数据时,在初始锚框的基础上得到预测框,把预测框和真实框比较,计算出两者差距并反向更新迭代更新网络结构参数,进行自适应锚框计算得到最佳锚框值。
[0014]作为本专利技术的更进一步改进,在步骤S1内,在YOLO v5s网络结构内进行训练时,将图片尺寸进行缩放。
[0015]作为本专利技术的更进一步改进,在步骤S2内,将608x608x3的图像进行切片操作后变成304x304x12大小,再进行32个卷积核的卷积操作,成为304x304x32的特征图。
[0016]作为本专利技术的更进一步改进,在步骤S2内,对卷积层特征图做最大池化,将不同尺寸的卷积层特征图拼接在一起。
[0017]一种基于YOLO v5s网络结构的目标检测系统,其中,包括:
[0018]输入模块,用于采集输入图片,对图片进行马赛克数据增强处理,再进行自适应锚框计算得到最佳锚框值,再进行图片尺寸处理缩放到一个固定尺寸;
[0019]骨干网络模块,用于对图片进行切片操作处理,再进行32个卷积核的卷积操作,然后对图片的卷积层特征图进行池化处理,将不同尺寸的卷积层特征图拼接在一起;
[0020]连接模块,用于采用双向特征金字塔网络将图片中不同辨率的特征进行融合;
[0021]输出模块,用于对融合特征后的图片进行输出。
[0022]本专利技术的有益效果是:与现有技术相比,本专利技术先进行图片的马赛克数据增强处理、自适应锚框计算和图片尺寸处理,而且还对图片进行切片后池化再进行特征图融合,在采用YOLO v5s原有的按通道维度拼接方法的同时,采用双向特征金字塔网络的双向网络进行融合,提高了小目标的检测的精度的效果。
附图说明
[0023]图1为本专利技术的基于YOLO v5s网络结构的目标检测方法的步骤框图;
[0024]图2为本专利技术的步骤S1的流程示意图;
[0025]图3为本专利技术的马赛克数据增强处理流程示意图;
[0026]图4为本专利技术的focus结构图;
[0027]图5为本专利技术的BiFPN网络结构图;
[0028]图6为本专利技术的特征融合网络示意图。
具体实施方式
[0029]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0030]请参照图1至图6,本专利技术的一种基于YOLO v5s网络结构的目标检测方法,包括如下步骤:
[0031]步骤S1、采集输入图片,对图片进行马赛克数据增强处理,再进行自适应锚框计算得到最佳锚框值,再进行图片尺寸处理缩放到一个固定尺寸;
[0032]步骤S2、对图片进行切片操作处理,再进行32个卷积核的卷积操作,然后对图片的卷积层特征图进行池化处理,将不同尺寸的卷积层特征图拼接在一起;
[0033]步骤S3、采用双向特征金字塔网络将图片中不同辨率的特征进行融合形成多尺度
特征融合,且将多尺度特征融合并入YOLO v5s网络结构内;
[0034]步骤S4、对融合特征后的图片进行检测,之后输出。
[0035]本专利技术进行了图片的马赛克数据增强处理、自适应锚框计算和图片尺寸处理,而且还对图片进行切片后池化再进行特征图融合,在采用YOLO v5s原有的按通道维度拼接方法的同时,采用双向特征金字塔网络的双向网络进行融合,提高了小目标的检测的精度的效果。
[0036]本专利技术还提供了一种基于YOLO v5s网络结构的目标检测系统,包括:
[0037]输入模块,用于采集输入图片,对图片进行马赛克数据增强处理,再进行自适应锚框计算得到最佳锚框值,再进行图片尺寸处理缩放到一个固定尺寸;
[0038]骨干网络模块,用于对图片进行切片操作处理,再进行32个卷积核的卷积操作,然后对图片的卷积层特征图进行池化处理,将不同尺寸的卷积层特征图拼接在一起;
[0039]连接模块,用于采用双向特征金字塔网络将图片中不同辨率的特征进行融合;
[0040]检测模块,用于对融合特征后的图片进行检测,之后输出的。
[0041]在步骤S1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于YOLO v5s网络结构的目标检测方法,其特征在于,包括如下步骤:步骤S1、采集输入图片,对图片进行马赛克数据增强处理,再进行自适应锚框计算得到最佳锚框值,再进行图片尺寸处理缩放到一个固定尺寸;步骤S2、对图片进行切片操作处理,再进行32个卷积核的卷积操作,然后对图片的卷积层特征图进行池化处理,将不同尺寸的卷积层特征图拼接在一起;步骤S3、采用双向特征金字塔网络将图片中不同辨率的特征进行融合形成多尺度特征融合,且将多尺度特征融合并入YOLO v5s网络结构内;步骤S4、对融合特征后的图片进行检测,之后输出。2.根据权利要求1所述的一种基于YOLO v5s网络结构的目标检测方法,其特征在于,在步骤S3内,将高分辨率的P2特征的信息引入多尺度特征融合中。3.根据权利要求2所述的一种基于YOLO v5s网络结构的目标检测方法,其特征在于,在步骤S4内,采用CIOU_Loss作为损失函数来进行检测区分每个目标框中预测框的相对位置。4.根据权利要求3所述的一种基于YOLO v5s网络结构的目标检测方法,其特征在于,在步骤S1内,对将图片中数据集取出batch,再从中随机取出4张图片,进行随机位置裁剪拼接成新图,循环进行后进行马赛克数据增强处理。5.根据权利要求4所述的一种基于YOLO v5s网络结构的目标检测方法,其特征在于,在步骤S1内,在不同的数据集中设定不同...

【专利技术属性】
技术研发人员:张佳帅李攀缪华桦张涌宁立许宜诚
申请(专利权)人:中国科学院深圳理工大学筹
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1