一种基于改进的Yolov5的自动驾驶目标检测算法制造技术

技术编号:38463355 阅读:13 留言:0更新日期:2023-08-11 14:40
本发明专利技术涉及自动驾驶技术领域,以深度学习为基础提出一种基于改进Yolov5的自动驾驶目标检测算法。该算法以Yolov5为基础,将轻量型注意力模块SimAM引入骨干网络中,在不增加参数量的前提下加速权值的计算;将原Yolov5网络中的PANet(路径聚合网络)结构替换为BiFPN(双向特征金字塔)结构;最后使用了轻量级上采样算子CARAFE,从而使整个网络在不引入过多的计算量同时获得更大的感受野。使得网络在保证实时性的前提下,达到较高检测精度。本发明专利技术在自动驾驶目标检测工作任务中可以提高对车和行人等目标的精度,达到较好的性能。达到较好的性能。达到较好的性能。

【技术实现步骤摘要】
一种基于改进的Yolov5的自动驾驶目标检测算法


[0001]本专利技术涉及自动驾驶
,以深度学习为基础提出一种基于改进Yolov5的自动驾驶目标检测算法。该算法以Yolov5为基础,将轻量型注意力模块SimAM引入骨干网络中,在不增加参数量的前提下加速权值的计算;将原Yolov5网络中的PANet(路径聚合网络)结构替换为BiFPN(双向特征金字塔)结构;最后使用了轻量级上采样算子CARAFE,从而使整个网络在不引入过多的计算量同时获得更大的感受野。使得网络在保证实时性的前提下,达到较高检测精度。

技术介绍

[0002]随着我国人民生活水平的日益提高,越来越多的家庭拥有私家车,城市内的汽车数量大幅增多导致交通环境问题日渐严重。因而造成了许多交通事故。我国每年因交通事故死亡人数约为6万人,其中城市道路事故死亡人数为3万人,农村道路为2万人。全国每五分钟就有一人死亡,每五分钟就有一人伤残,同时,每年我国因交通事故而造成的直接经济损失高达500亿元,占GDP的2%

3%。虽然如今我国的车辆已经拥有了防撞技术,但交通事故中也是伤亡最严重的一类,每年因交通事故导致的死亡人数为6万

10万。此外,国内外不少公司也开始陆续推出自动驾驶汽车,如果自动驾驶技术广泛运用车辆系统上,将会避免许多本可以避免的交通事故。对于自动驾驶系统中对行人和车辆的检测极为关键。行人车辆检测难点在于行人在图像中像素较小,难以保持高准确率,同时还难以快速对其进行检测。传统的对行人车辆检测方法往往是使用人工提取特征的目标检测算法,这种方法往往计算量较大且精度较低,无法运用在需要高精度和高实时性要求的自动驾驶领域。得益于近年来GPU加速技术和深度学习技术的发展,使得如今基于深度学习的行人车辆检测能够达到高精度和较好的实时性,有效的改善传统方法的效率低下问题,能够更好的避免交通事故的发生。
[0003]目前,对于自动驾驶汽车周围环境中的物体进行识别和分类,其
技术介绍
有以下几个方面:1、目标检测算法:包括传统的基于特征的方法(如Haar特征、HOG特征、SIFT特征等),以及近年来广泛应用的基于深度学习的方法(如Faster R

CNN、YOLO、SSD等);2、数据集:用于训练和测试目标检测算法的数据集,如COCO、VOC、KITTI等;3、传感器技术:自动驾驶汽车通常配备摄像头、激光雷达、毫米波雷达等多种传感器,以获取周围环境的信息;4、多传感器融合技术:将多个传感器所获取的信息进行融合,提高目标检测的准确性和鲁棒性;5、实时性优化技术:自动驾驶汽车需要在实时性要求较高的情况下完成目标检测,因此需要对算法进行优化,提高检测速度。例如,使用GPU加速、网络剪枝等方法。

技术实现思路

[0004]本专利技术提出一种改进的Yolov5算法,并将其应用在自动驾驶目标检测任务当中。在Yolov5的基础上,引入SimAM注意力机制模块,使得精练的特征更加聚焦在目标主体,同时不增加参数量和计算量;考虑到算法应用在自动驾驶任务中,提高算法的精度以及检测性能,采用BiFPN进行多尺度融合;最后,为了使其网络更加具有即时性,加入CARAFE轻量级上采样算子。综合以上方法,使得该算法在保证即时的前提下,可以达到更好的精度与较强的性能。
[0005]为了实现上述目的,一种基于改进Yolov5的自动驾驶目标检测算法具体步骤如下:步骤一:导入自动驾驶场景下的计算机视觉算法评测数据集KITTI,考虑到实际场景的复杂性,将其原8个类别合并成3个类别。
[0006]步骤二:引入SimAM注意力机制模块对特征图信息进行聚焦。
[0007]步骤三:对输入特征图进行轻量级上采样CARAFE处理,使用输入特征映射来预测上采样内核,每个位置的上采样内核是不同的,然后基于预测的上采样内核执行特征重组。
[0008]步骤四:特征图通过BiFPN网络进行多尺度特征融合,相当于给各个层赋予了不同权重去进行融合,让网络更加关注重要的层次,减少一些不必要的层的结点连接。
[0009]所述步骤一中的具体情况如下:本实验训练和验证均在KITTI公开数据集进行。数据集共7481张图片,分8个类别:汽车、箱式汽车、货车、行人、坐着的人、骑车的人、电车和杂项。在实验中考虑到实际场景的复杂性,将数据集的类别进行调整,汽车、箱式汽车与货车合并为汽车;将行人与坐着的人合并为人;骑车的人不作调整;删除最后两个类别。最终得到样本数:汽车33261个、行人4709个、骑车的人1627个。Batch size设置为8。
[0010]所述步骤二中的具体情况如下:输入特征图通过度量神经元之间的线性可分性去寻找重要神经元,并对每个神经元通过以下能量函数定义:其中,
[0011]最小化上述公式等价于训练统一通道内神经元t与其他神经元之间的线性可分性。采用二值标签,并添加正则项,最终能量函数定义为:每个通道有个能量函数,对上述公式的解析如下:
因此最小能量可以通过如下公式得到:到目前为止,推导了能量函数并挖掘了神经元的重要性。按照注意力机制的定义,需要对特征进行增强处理:通过这一步处理之后主干网络输出特征图到颈部网络中。
[0012]所述步骤三中的具体情况如下:轻量级上采样算子CARAFE分为两个主要模块,分别是上采样核预测模块和特征重组模块。假设上采样倍率为,给定一个形状为的输入特征图,CARAFE首先利用上采样核预测模块预测上采样核,然后利用特征重组模块完成上采样,得到形状为的输出特征图。其中参数量计算公式为:只有同步增加才能提升性能,单独增加一个无法提升性能;遵循,这里使用。
[0013]所述步骤四中的具体情况如下:BiFPN,在PANet简化版的基础上,若输入和输出结点是同一等级的,则添加一条额外的边,在不增加cost的同时融合更多的特征。与只有一个自顶向下和一个自底向上路径的PANet不同,我们处理每个双向路径(自顶向下和自底而上)路径作为一个特征网络层,并重复同一层多次,以实现更高层次的特征融合。由于不同的输入特征具有不同的分辨率,它们对输出特征的贡献通常是不相等的。为了解决这个问题,为每个输入添加额外的权重,并让网络了解每个输入特征的重要性。
[0014]无边界融合:其中是一个可学习的权重,可以是标量、向量、多维度张量。由于标量权重是无界的,它可能会导致训练不稳定。因此,我们采用权重归一化限定每个权重的取值范围。
[0015]基于Softmax的融合:将Softmax应用于每个权重,使
得所有权中被归一化为值范围从0到1的概率,表示每个输入的重要性。
[0016]Fastnormalizedfusion快速归一化融合:其中,再通过Relu之后来确保数值的稳定。每个归一化权重的值也在0和1之间。
附图说明
[0017][0018]图1为Yolov5网络结构图;
[0019]图2为本专利技术所使用的CARAFE整体框架图;
[0020]图3为本专利技术所使本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进Yolov5的自动驾驶目标检测算法,包括以下步骤:Step1:导入自动驾驶场景下的计算机视觉算法评测数据集KITTI,考虑到实际场景的复杂性,将其原8个类别合并成3个类别。2.Step2:引入SimAM注意力机制模块对特征图信息进行聚焦。3.Step3:对输入特征图进行轻量级上采样CARAFE处理,使用输入特征映射来预测上采样内核,每个位置的上采样内核是不同的,然后基于预测的上采样内核执行特征重组。4.Step4:特征图通过BiFPN网络进行多尺度特征融合,相当于给各个层赋予了不同权重去进行融合,让网络更加关注重要的层次,减少一些不必要的层的结点连接。5. 根据权利要求1所述的一种基于改进Yolov5的自动驾驶目标检测算法,所述Step 1中的具体过程如下:Step1.1 将输入的自动驾驶街道图像从原来的8个类别合并为3个类别,Batch size设置为8。6.根据权利要求1所述的一种基于改进Yolov5的自动驾驶目标检测算法,所述Step 2中的具体过程如下:Step2.1 在模型内引入SimAM注意力机制模块,并放置在主干网络的池化层之后;Step2.2 对每个输入的特征图寻找最重要的神经元,并将每个神经元用能...

【专利技术属性】
技术研发人员:侯阿临孙佳宇操文徐民俊炎梦雪张俊鹏任子航石双贾兆年洪怡马甜甜
申请(专利权)人:长春工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1