本发明专利技术涉及一种基于改进YOLOv5模型的小目标检测方法,本发明专利技术通过主干网络特征提取部分加入子注意力机制模块,增强小指示灯周围的上下文信息,同时抑制没有指示灯的背景区域权重,达到增强特征图目标权重的目的,对通道和空间位置进行并行注意力机制提取,从而从整体提高网络的表征能力,在改进的网络中用条件残差单元Res unit代替CSP结构,直接将残差思想应用于单元中,条件残差单元中条件卷积更关注与目标相关的特征,相当于注意力机制,在对特征进行采样的同时,又能扩展特征通道。残差结构可以避免采样过程中梯度消失的问题,并且能更好地的保留底层特征,增强特征融合过程中特征的多样性。征的多样性。征的多样性。
【技术实现步骤摘要】
一种基于改进YOLOv5模型的小目标检测方法
[0001]本专利技术属于目标检测领域,特别是一种基于改进YOLOv5模型的小目标检测方法。
技术介绍
[0002]小目标检测是图像分析处理领域的一个重要研究方向,利用计算机对远距离捕获的图像数据进行有效分析和处理,识别不同类别的目标并标注其所在位置,被广泛应用于城市智慧交通、抗灾救灾、边防安全等场景,这项研究节省大量人力和时间成本,因此小目标检测技术具有十分重要的研究意义和实用价值。所谓小目标指的是目标成像尺寸较小,通常有两种定义方式:(1)绝对尺寸大小,在COCO数据集中,尺寸小于32
×
32像素的目标被认为是小目标;(2)相对尺寸大小,根据国际光学工程学会定义,小目标为256
×
256像素的图像中成像面积小于80像素的目标,即若目标的尺寸小于原图的0.12%则可以认为是小目标。小目标检测的难点主要在于以下几点:(1)目标像素面积小,包含的特征信息过少,尤其是红外图像特征信息缺失严重;(2)数据集分布不平衡,现有标准数据集中小目标占比较小,存在严重的图像级不平衡;(3)数据集中存在目标遮挡、模糊、不完整现象,导致小目标信息缺失严重。
技术实现思路
[0003]本专利技术所要解决的技术问题是提供一种基于改进YOLOv5模型的小目标检测方法及其制备方法。
[0004]一种基于改进YOLOv5模型的小目标检测方法,包括以下步骤:
[0005]步骤S1、构建改进的YOLOv5模型,采集用于小目标检测的数据,制作YOLO标签格式的图像数据集;
[0006]步骤S2、将图像数据集输入到网络进行数据增强;
[0007]步骤S3、图像数据集进行数据增强后输入特征提取网络,特征提取的主干网络采用改进的CSPDarkNet,其中在原始YOLOv5的主干网络中删除了Focus结构,五层网络结构分别由下采样条件卷积层、SPP模块和条件残差单元Res unit组成,分别从第三、四、五层得到三种不同尺度的特征图;
[0008]步骤S4、将步骤S3得到的特征图传输到目标检测网络的颈部,颈部结构采用基于CCSP2网络结构的FPN+PAN特征融合网络,通过自顶向下和自底向上两种方式进行特征融合,最终得到三种不同尺度的强化特征图;
[0009]步骤S5、将步骤4得到的强化特征图输入到目标检测网络的头部,三种强化特征图分别再做一次条件卷积,进一步筛选并加强与特定类相关的特征,最终得到三种不同尺度的预测特征图;预测先验框由数据集聚类动态获得,预测网络通过非极大抑制输出最终预选框并映射为原图大小,最终得到目标物体的检测结果。
[0010]进一步的,所述步骤S1中构建改进的YOLOv5模型的方法包括以下步骤:
[0011]S11、构建通道
‑
空间并行的注意力机制模块;
[0012]S12、将注意力模块添加至对应网络层中;
[0013]S13、将主干网络CSPDarknet的21层输出的160x160尺寸的特征图与网络的第2层特征图进行concat操作,作为第4个检测头的输入模块。
[0014]进一步的,步骤S2中的数据增强采用4张图像随机缩放、随机裁剪、随机排列的方式进行拼接。
[0015]进一步的,所述步骤S11包括以下步骤:
[0016]步骤S111、注意力机制模块对特征图中的二维空间特征进行特征增强;
[0017]步骤S112、注意力模块对拼接特征图中的一维通道特征进行特征增强。
[0018]本专利技术的有益效果为:本专利技术通过主干网络特征提取部分加入子注意力机制模块,增强小指示灯周围的上下文信息,同时抑制没有指示灯的背景区域权重,达到增强特征图目标权重的目的,对通道和空间位置进行并行注意力机制提取,从而从整体提高网络的表征能力,在改进的网络中用条件残差单元Res unit代替CSP结构,直接将残差思想应用于单元中,条件残差单元中条件卷积更关注与目标相关的特征,相当于注意力机制,在对特征进行采样的同时,又能扩展特征通道。残差结构可以避免采样过程中梯度消失的问题,并且能更好地的保留底层特征,增强特征融合过程中特征的多样性。
附图说明
[0019]图1为本专利技术的方法流程图。
具体实施方式
[0020]下面将结合附图对本专利技术的技术方案进行清楚、完整地描述。
[0021]如图1所示,一种基于改进YOLOv5模型的小目标检测方法,包括以下步骤:
[0022]步骤S1、构建改进的YOLOv5模型,采集用于小目标检测的数据,制作YOLO标签格式的图像数据集;
[0023]步骤S2、将图像数据集输入到网络进行数据增强;
[0024]步骤S3、图像数据集进行数据增强后输入特征提取网络,特征提取的主干网络采用改进的CSPDarkNet,其中在原始YOLOv5的主干网络中删除了Focus结构,五层网络结构分别由下采样条件卷积层、SPP模块和条件残差单元Res unit组成,分别从第三、四、五层得到三种不同尺度的特征图;
[0025]步骤S4、将步骤S3得到的特征图传输到目标检测网络的颈部,颈部结构采用基于CCSP2网络结构的FPN+PAN特征融合网络,通过自顶向下和自底向上两种方式进行特征融合,最终得到三种不同尺度的强化特征图;
[0026]步骤S5、将步骤4得到的强化特征图输入到目标检测网络的头部,三种强化特征图分别再做一次条件卷积,进一步筛选并加强与特定类相关的特征,最终得到三种不同尺度的预测特征图;预测先验框由数据集聚类动态获得,预测网络通过非极大抑制输出最终预选框并映射为原图大小,最终得到目标物体的检测结果。
[0027]作为一种实施方式,所述步骤S1中构建改进的YOLOv5模型的方法包括以下步骤:
[0028]S11、构建通道
‑
空间并行的注意力机制模块;
[0029]S12、将注意力模块添加至对应网络层中;
[0030]S13、将主干网络CSPDarknet的21层输出的160x160尺寸的特征图与网络的第2层特征图进行concat操作,作为第4个检测头的输入模块;
[0031]作为一种实施方式,步骤S2中的数据增强采用4张图像随机缩放、随机裁剪、随机排列的方式进行拼接。
[0032]作为一种实施方式,所述步骤S11包括以下步骤:
[0033]步骤S111、注意力机制模块对特征图中的二维空间特征进行特征增强;
[0034]步骤S112、注意力模块对拼接特征图中的一维通道特征进行特征增强。
[0035]本专利技术通过主干网络特征提取部分加入子注意力机制模块,增强小指示灯周围的上下文信息,同时抑制没有指示灯的背景区域权重,达到增强特征图目标权重的目的,对通道和空间位置进行并行注意力机制提取,从而从整体提高网络的表征能力,在改进的网络中用条件残差单元Res unit代替CSP结构,直接将残差思想应用于单元中,条件残差本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于改进YOLOv5模型的小目标检测方法,其特征在于:包括以下步骤:步骤S1、构建改进的YOLOv5模型,采集用于小目标检测的数据,制作YOLO标签格式的图像数据集;步骤S2、将图像数据集输入到网络进行数据增强;步骤S3、图像数据集进行数据增强后输入特征提取网络,特征提取的主干网络采用改进的CSPDarkNet,其中在原始YOLOv5的主干网络中删除了Focus结构,五层网络结构分别由下采样条件卷积层、SPP模块和条件残差单元Res unit组成,分别从第三、四、五层得到三种不同尺度的特征图;步骤S4、将步骤S3得到的特征图传输到目标检测网络的颈部,颈部结构采用基于CCSP2网络结构的FPN+PAN特征融合网络,通过自顶向下和自底向上两种方式进行特征融合,最终得到三种不同尺度的强化特征图;步骤S5、将步骤4得到的强化特征图输入到目标检测网络的头部,三种强化特征图分别再做一次条件卷积,进一步筛选并加强与特定类相关的特征,最终得到三种不同尺度的预测特征图;预测先验框由数据集聚类...
【专利技术属性】
技术研发人员:姚冲,
申请(专利权)人:武汉纺织大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。