一种基于改进YOLOv5的小目标识别方法技术

技术编号:36528720 阅读:46 留言:0更新日期:2023-02-01 16:09
本发明专利技术涉及目标检测技术领域,且公开了一种基于改进YOLOv5的小目标识别方法,包括步骤:S1、构建改进的YOLOv5模型,所述S1包括:S11、构建通道

【技术实现步骤摘要】
一种基于改进YOLOv5的小目标识别方法


[0001]本专利技术涉及目标检测
,具体为一种基于改进YOLOv5的小目标识别方法。

技术介绍

[0002]目前,基于深度神经网络的目标检测方法主要有一阶段和二阶段两类。2阶段的目标检测算法主要先通过区域提取网络区分前景和背景,然后对前景感兴趣区域进行分类和回归,得到最终的检测结果,其代表模型为Faster R

CNN,DetectorRs等。一阶段的目标检测算法是直接从网络所提取的特征图中进行分类和回归,然后通过非极大值抑制方法得到最终的检测结果,代表的模型为YOLO系列。二阶段的模型检测准确度较高,但模型复杂,计算量较大,不适合在巡检机器人的边缘段进行部署,因此本专利采用YOLOv5模型作为服务器指示灯的检测基准模型。
[0003]然而小目标在图像中所占像素较小。在分辨率为1920x1080的标清图像上,一个指示灯所占像素在8x7左右的大小,在图像经过主干网络提取特征,经过多次下采样的情况下,目标的特征信息逐渐丢失,难以被网络检测,易漏检。因此需要对YOLOv5的模型进行改进优化,提高其对小目标的检测精度。

技术实现思路

[0004](一)解决的技术问题
[0005]针对现有技术的不足,本专利技术提供了一种基于改进YOLOv5的小目标识别方法,能够在保证计算速度的前提下,通过增加检测头,增强模型的多尺度学习能力,同时通过子注意力机制,增加小目标周围的上下文信息,最后通过优化目标的损失函数,提高模型检测目标框的回归能力,从而全面提高模型对小目标的检测精度,解决了
技术介绍
中提出的问题。
[0006](二)技术方案
[0007]为实现上述通过增加检测头,增强模型的多尺度学习能力,同时通过子注意力机制,增加小目标周围的上下文信息,最后通过优化目标的损失函数,提高模型检测目标框的回归能力,从而全面提高模型对小目标的检测精度目的,本专利技术提供如下技术方案:
[0008]一种基于改进YOLOv5的小目标识别方法,包括步骤:
[0009]S1、构建改进的YOLOv5模型,所述S1包括:
[0010]S11、构建通道

空间并行的注意力机制模块;
[0011]S12、将注意力模块添加至对应网络层中;
[0012]S13、将主干网络CSPDarknet的21层输出的160x160尺寸的特征图与网络的第2层特征图进行concat操作,作为第4个检测头的输入模块;
[0013]S2、替换YOLOv5原有的CIOU损失函数,训练模型;
[0014]S3、完成训练后,对模型进行部署。
[0015]优选的,所述S11包括第一步骤:
[0016]S111、注意力机制模块对特征图中的二维空间特征进行特征增强,所述S111包括
如下步骤:
[0017]S1111、采用2个1
×
1卷积生成空间注意力机制模块中的查询权重wsq和键值权重wsk;
[0018]S1112、对查询权重进行全局最大池化操作;
[0019]S1113、分别对查询权重和键值权重进行reshape操作,重整权重尺寸的矩阵形式;
[0020]S1114、采用softmax函数对查询矩阵进行激活操作,将其映射在(0,1)之内;
[0021]S1115、查询矩阵与键值矩阵进行矩阵相乘、reshape操作和sigmoid函数激活,得到特征图在空间上的权重特征张量;
[0022]S1116、将空间权重特征张量与输入特征图进行点乘,得到特征图在二维空间增强特征的输出。
[0023]优选的,所述S11还包括第二步骤:
[0024]S112、注意力模块对拼接特征图中的一维通道特征进行特征增强,所述S112包括以下步骤:
[0025]S1121、采用2个1
×
1卷积生成通道注意力机制中的查询权重wcq和键值权重wck;
[0026]S1122、对查询权重和键值权重进行reshape操作,生成对应的矩阵;
[0027]S1123、将查询矩阵通过softmax映射到(0,1)之间;
[0028]S1124、将2矩阵进行矩阵相乘,得到通道的权重矩阵;
[0029]S1125、通道的权重矩阵经过1
×
1卷积、层归一化操作和Sigmoid的特征映射,得到通道特征权重张量;
[0030]S1126、通道特征权重张量与输入的特征图进行点乘操作,实现特征图中的一维通道特征的特征增强。
[0031]优选的,所述主干网络的设置有若干注意力机制模块,若干所述注意力机制模块分别位于主干网络的第21、24、27、30层,且所述通道与空间位置进行并行注意力机制模块。
[0032]优选的,所述改进的YOLOv5采用IOU loss作为计算目标框回归的损失函数。
[0033](三)有益效果
[0034]与现有技术相比,本专利技术提供了一种基于改进YOLOv5的小目标识别方法,具备以下有益效果:
[0035]该基于改进YOLOv5的小目标识别方法,通过对检测头进行了改进,增加了一个更高分辨率的检测头,从主干网络CSPDarknet的21层输出的160x160尺寸的特征图与网络的第2层特征图进行concat操作,以此获得更高分辨率的特征图,作为检测头的输入,则该检测头的输出为10x10的目标,和指示灯的像素尺寸基本相同,从而大大提高目标的检测精度,通过主干网络特征提取部分加入子注意力机制模块,增强小指示灯周围的上下文信息,同时抑制没有指示灯的背景区域权重,达到增强特征图目标权重的目的,对通道和空间位置进行并行注意力机制提取,从而从整体提高网络的表征能力,能够在保证计算速度的前提下,通过增加检测头,增强模型的多尺度学习能力,同时通过子注意力机制,增加小目标周围的上下文信息,最后通过优化目标的损失函数,提高模型检测目标框的回归能力,从而全面提高模型对小目标的检测精度,保证了实用性。
附图说明
[0036]图1为本专利技术提出的一种基于改进YOLOv5的小目标识别方法中改进的yolov5整体架构示意图;
[0037]图2为本专利技术提出的一种基于改进YOLOv5的小目标识别方法中通道和空间位置进行并行注意力机制模块示意图;
[0038]图3为本专利技术提出的一种基于改进YOLOv5的小目标识别方法中损失函数示意图;
[0039]图4为现有yolov5基本架构示意图。
具体实施方式
[0040]下面将结合本专利技术的实施例,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0041]请参阅图1

3,一种基于改进YOLOv5的小目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5的小目标识别方法,其特征在于:包括步骤:S1、构建改进的YOLOv5模型,所述S1包括:S11、构建通道

空间并行的注意力机制模块;S12、将注意力模块添加至对应网络层中;S13、将主干网络CSPDarknet的21层输出的160x160尺寸的特征图与网络的第2层特征图进行concat操作,作为第4个检测头的输入模块;S2、替换YOLOv5原有的CIOU损失函数,训练模型;S3、完成训练后,对模型进行部署。2.根据权利要求1所述的一种基于改进YOLOv5的小目标识别方法,其特征在于:所述S11包括第一步骤:S111、注意力机制模块对特征图中的二维空间特征进行特征增强,所述S111包括如下步骤:S1111、采用2个1
×
1卷积生成空间注意力机制模块中的查询权重wsq和键值权重wsk;S1112、对查询权重进行全局最大池化操作;S1113、分别对查询权重和键值权重进行reshape操作,重整权重尺寸的矩阵形式;S1114、采用softmax函数对查询矩阵进行激活操作,将其映射在(0,1)之内;S1115、查询矩阵与键值矩阵进行矩阵相乘、reshape操作和sigmoid函数激活,得到特征图在空间上的权重特征张量;S1116、将空间权重特征张量与输入特征图进行...

【专利技术属性】
技术研发人员:蒋伟田子豪谷玉龙
申请(专利权)人:河南云巡智能科技研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1