当前位置: 首页 > 专利查询>三峡大学专利>正文

一种基于改进YOLOv3算法的车辆目标检测方法技术

技术编号:38712286 阅读:13 留言:0更新日期:2023-09-08 14:55
本发明专利技术公开了一种基于改进YOLOv3算法的车辆目标检测方法,涉及计算机视觉技术领域,包括下述几个步骤:获取真实场景下的车辆目标图像,并对车辆图像进行数据增强;改进YOLOv3网络,使网络变得更加轻量化,在多尺度特征融合部分嵌入注意力机制CBAM,并引入新的损失函数;训练改进后的YOLOv3网络,并进行特征提取;最后使用训练好的模型来进行车辆目标检测。本发明专利技术解决了原算法应用于车辆目标检测时存在的实时性和精确性不足的问题,实现了在理想的检测精度下快速准确的检测出车辆目标。检测精度下快速准确的检测出车辆目标。检测精度下快速准确的检测出车辆目标。

【技术实现步骤摘要】
一种基于改进YOLOv3算法的车辆目标检测方法


[0001]本专利技术涉及计算机视觉
,具体为一种基于改进YOLOv3算法的车辆目标检测方法。

技术介绍

[0002]近年来伴随着5G和人工智能技术的迅猛发展,智能交通逐渐成为可能,车辆目标检测方法的研究就具有了重要意义。车辆目标检测一方面可以帮助实现智能交通系统,提高道路交通的安全性和效率,另一方面可以促进整个智能汽车行业的发展,推动产业创新。
[0003]卷积神经网络中的目标检测算法可以大致分为两类:基于区域提取的目标检测算法和单阶段的目标检测算法。基于区域提取的目标检测算法一般由两个阶段组成。首先,该算法会使用一个候选框生成器(例如选择性搜索或RPN)在图像中生成若干个候选框,这些候选框通常数量很多。接下来,在每个候选框上应用分类器和回归器对对象进行分类和位置校正。这些分类器和回归器通常是通过卷积神经网络实现的。著名的基于区域提取的目标检测算法有RCNN、Fast RCNN和Faster RCNN等。而单阶段的目标检测算法则只需要一个前向传播过程就可以同时完成候选框生成、分类和位置回归。这种算法的优点是速度快,但缺点是精度相对较低。著名的单阶段目标检测算法包括YOLO和SSD等。
[0004]现阶段的车辆目标检测算法多数都是基于深度学习,但是若应用于真实场景下仍然存在实时性和精确性不足等问题,所以就需要进行改进算法的研究,进而解决模型参数量大和检测效果差等问题。

技术实现思路

[0005]为了攻克上述难关,本专利技术提出了一种基于改进YOLOv3算法的车辆目标检测方法,在降低模型参数量的同时提高了网络的检测精度,实现了在理想检测效果下的模型的轻量化。
[0006]为实现上述目的,专利技术提供如下技术方案:
[0007]一种基于改进YOLOv3算法的车辆目标检测方法,包括以下步骤:
[0008]步骤1,获取车辆图像,划分训练集、验证集和测试集,并对车辆图像进行数据增强操作;
[0009]步骤2,首先改进YOLOv3算法,使网络变得更加轻量化,其次在多尺度特征融合部分嵌入注意力机制CBAM,可以使网络在训练过程中更加关注目标区域,最后引入新的损失函数,提升网络的学习能力;
[0010]步骤3,训练改进后的YOLOv3算法,进行特征提取,其中使用Adam优化方法进行实验训练,初始学习率设置为0.001,Batch Size设置为16,采用学习率自动衰减策略,如果经过3次迭代损失值没有降低,就将学习率变为原来的一半;
[0011]步骤4,将测试集中的图像输入到训练好的最佳模型中,模型将待测车辆目标用框标记出来,也可使用该模型对行车视频进行检测,获取视频流检测结果。
[0012]作为进一步技术限定,所述的轻量化是通过引入EfficientNetv2和ShuffleNetv2的残差块结构,对YOLOv3网络进行轻量化改造,降低了模型的参数量,进而实现模型轻量化的目的。改进措施如下:在骨干网络的浅层部分使用EfficientNetv2的Fused

MBConv模块,重复堆叠次数为2和8,这样做能够明显提升网络的训练速度;在骨干网络的深层部分使用ShuffleNetv2的残差模块,重复堆叠次数为8和4。整个改进后的骨干网络由浅入深分别进行2倍、4倍、8倍、16倍和32倍的下采样,并且选取最后的8倍、16倍和32倍的特征图作为之后特征融合网络的输入。
[0013]作为进一步技术限定,所述的注意力机制CBAM模块是由通道注意力模块和空间注意力模块组成,将前一步经过卷积运算的输入特征层通过一个通道注意力模块赋予不同的通道权重,再通过一个空间注意力模块考虑不同位置的重要性,最后就得到了调整后的特征层。注意力机制CBAM增强了重要特征,忽略了不重要的特征,可以使网络在训练过程中更加关注目标区域。其中,在多尺度特征融合部分的三个不同的检测层嵌入CBAM可以使网络在训练过程中更加关注目标本身,进而提高模型的检测效果。
[0014]作为进一步技术限定,所述的改进的损失函数由三部分组成:边框回归损失、置信度损失和分类损失。所述损失函数为L
loss
=L
reg
+L
conf
+L
cls
。式中,L
reg
是引入DIoU的边框回归损失,L
conf
是引入Focal Loss的置信度损失,L
cls
是二元交叉熵损失。其中,DIoU考虑到了两框之间的重叠面积和中心点距离,使两框之间的距离直接得到最小化,收敛速度更快;Focal Loss解决了单阶段检测算法的正负样本不均衡的问题,降低易分样本的权重,让模型去关注训练难分样本。
[0015]作为进一步技术限定,所述的数据增强是采用三种叠加形式数据增强方法,该三种叠加形式数据增强方法为几何变换+Cutout+Mosaic,数据增强不但可以扩充数据集图像的数量,而且能够增加训练图像的多样性,提升模型的泛化能力,减少过拟合现象的发生,提高算法的精度。
[0016]作为进一步技术限定,所述的实验选用谷歌公司提供的Colab平台,深度学习框架采用的是PyTorch,另外还使用了OpenCV、Numpy以及PIL等第三方库。
[0017]与现有技术相比,专利技术的有益效果:
[0018]1、本专利技术通过引入EfficientNetv2和ShuffleNetv2的残差块结构对YOLOv3网络进行轻量化改造,降低了模型的参数量,进而实现模型轻量化的目的;
[0019]2、本专利技术在多尺度特征融合部分的三个不同的检测层嵌入CBAM可以使网络在训练过程中更加关注目标本身,进而提高模型的检测效果;
[0020]3、本专利技术使用DIoU和Focal Loss来改进损失函数,解决了边框定位不准确和正负样本不均衡问题,提升了算法的检测精度;
[0021]4、相较于其他车辆目标检测算法,本专利技术所提出的改进算法具有良好的检测精度和检测速度,满足实时检测的要求,能够很好的应用于真实场景下的车辆目标检测任务中。
附图说明
[0022]图1为一种基于改进YOLOv3算法的车辆目标检测方法的流程图;
[0023]图2为改进的YOLOv3网络的结构示意图;
[0024]图3为改进的YOLOv3骨干网络的网络结构图;
[0025]图4为注意力机制CBAM示意图;
[0026]图5为图4中通道注意力模块示意图;
[0027]图6为图4中空间注意力模块示意图;
[0028]图7为在夜晚使用本专利技术进行车辆目标检测的效果图;
[0029]图8为在白天使用本专利技术进行车辆目标检测的效果图。
具体实施方式
[0030]下面将结合专利技术实施例中的附图,对专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是专利技术一部分实施例,而不是全部的实施例。基于专利技术中的实施例,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv3算法的车辆目标检测方法,其特征在于,所述方法包括以下步骤:步骤1,获取车辆图像,划分训练集、验证集和测试集,并对车辆图像进行数据增强操作;步骤2,首先改进YOLOv3算法,使网络变得更加轻量化,其次在多尺度特征融合部分嵌入注意力机制CBAM,可以使网络在训练过程中更加关注目标区域,最后引入新的损失函数,提升网络的学习能力;步骤3,训练改进后的YOLOv3算法,进行特征提取,其中使用Adam优化方法进行实验训练,初始学习率设置为0.001,Batch Size设置为16,采用学习率自动衰减策略,如果经过3次迭代损失值没有降低,就将学习率变为原来的一半;步骤4,将测试集中的图像输入到训练好的最佳模型中,模型将待测车辆目标用框标记出来,也可使用该模型对行车视频进行检测,获取视频流检测结果。2.如权利要求1中所述的一种基于改进YOLOv3算法的车辆目标检测方法,其特征在于,所述的轻量化是通过引入EfficientNetv2和ShuffleNetv2的残差块结构,对YOLOv3网络进行轻量化改造,降低了模型的参数量,进而实现模型轻量化的目的;改进措施如下:在骨干网络的浅层部分使用EfficientNetv2的Fused

MBConv模块,重复堆叠次数为2和8,这样做能够明显提升网络的训练速度;在骨干网络的深层部分使用ShuffleNetv2的残差模块,重复堆叠次数为8和4;整个改进后的骨干网络由浅入深分别进行2倍、4倍、8倍、16倍和32倍的下采样,并且选取最后的8倍、16倍和32倍的特征图作为之后特征融合网络的输入。3.如权利要求1中所述的一种基于改进YOLOv3算法的车辆目标检测方法,其特征在于,所述的注意力机制CBAM模块是由通道注意力模块和空间注意力模块组成,将前一步经过卷积运算的输入特征层通过一个通道注意力模块赋予不同的通...

【专利技术属性】
技术研发人员:邹伙宗邓守城
申请(专利权)人:三峡大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1