一种基于改进YOLOv5的小目标检测算法制造技术

技术编号:32823477 阅读:11 留言:0更新日期:2022-03-26 20:21
本发明专利技术公开了一种基于改进YOLOv5的小目标检测算法,所述方法包括:第一步,将采集到的待测人脸口罩数据集使用Mosaic

【技术实现步骤摘要】
一种基于改进YOLOv5的小目标检测算法


[0001]本专利技术涉及小目标检测
,具体涉及一种基于改进YOLOv5的小目标检测算法。

技术介绍

[0002]目标检测作为计算机视觉领域的核心问题之一,是利用图像处理、深度学习等技术,从图像或视频中定位感兴趣的对象,通过目标分类判断输入图像中是否包含目标,用目标定位找出目标物体位置并框出目标,其任务是锁定图像中的目标,定位目标位置、确定目标类别,被广泛应用于人脸识别、自动驾驶、行人检测、智能监控等计算机视觉领域。传统的目标检测算法由3部分组成,分别是区域选择、特征提取和分类器,但由于其存在手工设计的特征鲁棒性差、区域选择策略没有针对性等特点,检测效果并不理想。
[0003]早期的目标检测方法是使用手工提取特征,再在此基础上构造模型。使用该方法设计的模型不仅结构复杂,而且难以提升精度。随着深度学习的发展,人们发现卷积神经网络具有极好的学习特征的能力,基于深度卷积神经网络的特征提取技术被广泛应用到计算机视觉任务中,目标检测完成了从基于传统手工设计特征的检测方法到基于卷积神经网络的深度学习方法的变迁,随后基于卷积神经网络的目标检测算法迅速成为图像处理领域研究的主流。卷积神经网络相比于传统的手工设计的提取算子提取的特征更加丰富,模型的泛化能力更强。
[0004]虽然目前这些优秀的目标检测算法在大型通用的数据集上已经取得了非常好的成绩,但小目标检测长期以来就是目标检测中的重点和难点之一,目标检测中对小目标的定义通常有两种,一种是相对尺寸大小,另一种是根据具体的数据集对小目标进行定义。相比于常规目标,小目标在图像中所占的像素数较少,分辨率低,信息量少,特征表达能力弱。早期的目标检测方法是使用手工提取特征,再在此基础上构造模型。使用该方法设计的模型不仅结构复杂,而且难以提升精度,检测模型在检测速度上仍有一定差距。

技术实现思路

[0005]本专利技术的目的是提出一种基于改进YOLOv5的小目标检测算法,通过使用Mosaic

8方法进行数据增强,增加一个浅层特征图,调整损失函数增强网络对小目标的感知能力,通过修改目标框回归公式,解决训练过程中梯度消失等问题,提升小目标检测精度。
[0006]为了实现上述任务,改善现有技术存在的缺陷,本专利技术提供了一种基于改进YOLOv5的小目标检测方法,包括:
[0007]第一步,将采集到的待测人脸口罩数据集使用Mosaic

8数据增强,即采用8张图片随机裁剪、随机排列、随机缩放,然后组合成一张图片,同时合理引入一些随机噪声。
[0008]第二步,在YOLOv5特征融合网络中添加一个新尺度的特征提取层,并调整YOLOv5网络的目标框回归公式,改进损失函数。
[0009]第三步,将增强后的数据送入网络中进行迭代训练,并使用余弦退火算法对学习
率进行调整。
[0010]第四步,训练完成后,将待检测图片送入至训练后得到的最佳模型中,检测目标类别及位置,最终得到识别结果。
[0011]进一步地,所述小目标检测模型的搭建包括:
[0012]在原始YOLOv5的基础上,在Backbone骨干网络和Head网络中,新增尺寸为输入图像尺寸四分之一的特征图,提升对小目标数据的挖掘,采用多尺度反馈以引入全局上下文信息。
[0013]在YOLOv5骨干网络的基础上对原始输入图片增加一个4倍下采样的过程,原始图片经过4倍下采样后送入到特征融合网络得到新尺寸的特征图。
[0014]将低层特征图与高层特征图进行信息融合,使特征金字塔网络与路径聚合网络(PAN, Path Aggregation Network)相结合,特征金字塔网络自顶向下传递深层次语义特征,路径聚合网络自底向上传递目标的位置信息。
[0015]利用预处理后的数据集训练上述小目标检测网络,完成模型迭代后得到最优检测模型,从而建立小目标检测网络。
[0016]进一步地,将所述数据集输入至算法模型之前,还包括:
[0017]利用标记软件LabelImg对数据集进行YOLO格式的标注,数据集中的图片标签共分为两类,分别是bad(未佩戴口罩)和good(佩戴口罩)。
[0018]标注完成后,每一张图片都对应着一个与该图片名称相同的txt文件,txt文件中的每一行表示一个标记实例,共5列,从左到右分别表示标签类别、标记框中心横坐标与图片宽度的比值、标记框中心纵坐标与图片高度的比值、标记框宽度与图片宽度的比值、标记框高度与图片高度的比值。
[0019]从WIDER FACE、MAPA(Masked Faces)这两个公开数据集和网络中手动筛选出含有多人场景下的佩戴口罩和未佩戴口罩的人脸图片,最终得到训练集4000张,测试集1320张,共计5320张。
[0020]进一步地,选择CIoU替代GIoU作为目标框回归的损失函数。
[0021]进一步地,本实验总迭代次数设置为140次,迭代批量大小设置为32,选择SGD优化器。
[0022]进一步地,模型训练时学习率使用Warmup训练预热,在Warmup阶段,偏置层的学习率由0.1下降至0.01,其他的参数学习率由0增加至0.01,Warmup结束之后,采用余弦退火学习算法对学习率进行更新。
[0023]进一步地,对目标框公式进行修改。对真实目标框的预测,通过预测相对位置的方法预测出目标框相对于左上角的相对坐标。最终得到预测目标框的中心坐标b
x
、b
y
和宽高b
w
、 b
h

[0024]目标框公式如下所示:
[0025]b
x
=2σ(t
x
)

0.5+c
x
[0026]b
y
=2σ(t
y
)

0.5+c
y
[0027]b
w
=p
w
(2σ(t
w
))2[0028]b
h
=p
h
(2σ(t
h
))2[0029]P
r
(object)*IOU(b,object)=σ(t
o
)
[0030]其中,σ(t
o
)是预测框的置信度,由预测框的概率和预测框与真实框的IoU值相乘得到。对σ(t
o
)设定阈值,过滤掉置信度较低的预测框,然后再对剩下的预测框用非极大值抑制算法(NMS,Non

Maximum Suppression)得到最终的预测框。
[0031]与现有技术相比,本专利技术具有以下有益效果:
[0032]1、采用Mosaic

8数据增强,丰富了数据集,同时增加了小样本目标,可以提升网络训练速度,在进行归一化操作时,可以一次性计算8张本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5的小目标检测算法,其特征在于,包括:步骤一,对所收集到的人脸口罩数据集进行数据标注,并使用Mosaic

8数据增强方法对数据集进行数据增强。步骤二,在YOLOv5特征融合网络中添加一个新尺度的特征提取层,并调整YOLOv5网络的目标框回归公式,改进损失函数。将所得数据集中的图片进行特征提取与目标定位分类。步骤三,将增强后的数据送入网络中进行迭代训练,并使用余弦退火算法对学习率进行调整。步骤四,训练完成后,将待检测图片送入至训练后得到的最佳模型中,检测目标类别及位置,最终得到识别结果。2.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,本发明在原有YOLOv5算法的基础上,分别从Mosaic

8数据增强、特征提取器、损失函数和目标框回归四个方面进行改进,有效地增强了YOLOv5网络模型对小目标物体的检测精度,改进后的算法检测速率相较于原始YOLOv5算法有所降低,但仍能满足实时性的要求,可以直接应用在自动驾驶、医学图像、遥感图像分析和红外图像中的小目标检测等实际生活场景中。并且在密集人群口罩佩戴检测效果中表现突出,检测精度有明显上升,在人群密集的条件下误判和漏检的情况明显减少,对小目标异常角度、人脸区域存在遮挡的鲁棒性明显提升。3.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,本文数据集来源于WIDER FACE、MAPA(Masked Faces)这两个公开数据集和网络,从中手动筛选出含有多人场景下的佩戴口罩和未佩戴口罩的人脸图片,并对所收集到的人脸口罩数据集进行数据标注,最终得到训练集4000张,测试集1320张,共计5320张。4.根据权利要求3所述的对所收集到的人脸口罩数据集进行数据标注,其特征在于,利用标记软件LabelImg对数据集进行YOLO格式的标注,共有两个标记类别,分别是bad(未佩戴口罩)和good(佩戴口罩)。5.根据权利要求4所述的对数据集进行YOLO格式的标注,其特征在于,标注后的每一张图片都对应着一个与该图片名称相同的txt文件,txt文件中的每一行表示一个标记实例,共5列,从左到右分别表示标签类别、标记框中心横坐标与图片宽度的比值、标记框中心纵坐标与图片高度的比值、标记框宽度与图片宽度的比值、标记框高度与图片高度的比值。6.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,使用Mosaic

8数据增强方法对其数据集进行数据增强,即采用8张图片随机裁剪、随机排列、随机缩放,然后组合成一张图片,以此来增加样本的数据量,同时合理引入一些随机噪声,增强网络模型对图像中小目标样本的区分力,提升模型的泛化力。7.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,使用Mosaic

8数据增强方法对其数据集进行数据增强,实现丰富数据集的同时,增加了小样本目标,提升网络的训练速度。在进行归一化操作的同时,会一次性计算八张图片,因此模型对内存的需求降低。8.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,本发明在原始的YOLOv5特征提取模型的基础上进行改进,即本文在YOLOv5骨干网络的基础上对原始输入图片增加一个4倍下采样的过程,原始图片经过4倍下采样后送入到特征融合网络得到新尺寸的特征图,该特征图感受野较小,位置信息相对丰富,因此可以提升检测小尺寸口罩佩
戴目标的检测效果。9.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,改进后的特征融合网络将特征金字塔网络与路径聚合网络(PAN,Path Aggregation Network)相结合,特征金字塔网络自顶向下传递深层次语义特征,路径聚合网络自底向上传递目标的位置信息,通过自顶向下和自底向上的特征信息融合,使得模型可以更好地学习到特征,增强模型对小目标和遮挡目标的敏感度。10.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,在训练网络模型的过程中,本发明的损失函数由定位损失、置信度损失和类别损失三部分构成,其中使用CIoU替代GIoU作为目标框回归的损失函数来计算定位损失,而置信度损失和类别损失采用二元交叉熵损失函数进行计算。11.根据权利要求1所述的基于改进YOLOv5的小目标检测算法,其特征在于,本发明选择使用CIoU作为目标框回归的损失函数,CIoU综合考虑了真实框与预测框之间的重叠率、中心点距离、长宽比,能使得目标框回...

【专利技术属性】
技术研发人员:郭磊薛伟王邱龙马海钰肖怒马志伟郭济蒋煜祺
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1