一种用于自动驾驶车辆的道路多目标快速识别方法技术

技术编号:38500285 阅读:14 留言:0更新日期:2023-08-15 17:08
本发明专利技术公开了一种用于自动驾驶车辆的道路多目标快速识别方法,在YOLOv5s的网络架构基础上,建立了一种改进的Target

【技术实现步骤摘要】
一种用于自动驾驶车辆的道路多目标快速识别方法


[0001]本专利技术属于自动驾驶目标识别
,具体涉及一种用于自动驾驶车辆的道路多目标快速识别方法。

技术介绍

[0002]近年来,随着人民经济水平的不断提高,个人所拥有的汽车数量也不断增长,带来了交通拥堵及行驶安全等一系列问题。因此,改善汽车安全性能、降低交通事故率已成为各国政府和科研机构共同面临的重要难题,为此自动驾驶车辆应运而生。自动驾驶车辆的关键技术包括环境感知、精准定位、决策与规划、控制与执行、高精地图与车联网以及测试与验证,其中最关键的三大技术是感知定位,决策规划以及行为控制,这三大技术体系可简单概括为“感知、规划与执行”。而作为自动驾驶系统的核心技术之一,车辆对于周围交通环境的高效感知对于之后路径规划和后续的控制执行至关重要。
[0003]传统的目标检测算法,多是基于滑动窗口技术完成目标识别,即输入一张待检测的目标图像,利用滑动窗口针对图像中存在的目标设置候选框,再根据候选框中目标特征信息的不同,完成特征信息提取,最后利用级联分类器进行目标识别。在整个识别过程中容易产生大量的冗余候选框,导致检测速度慢,此外分类器的特征识别为手动选取,鲁棒性低,对于不同交通场景的泛化性能较差。
[0004]近些年来,随着机器学习,尤其是深度学习算法的推陈出新,基于深度学习的目标识别方法日渐成为主流,其大致可以分为两类。
[0005]第一类称为“Two

Stage”检测算法,例如Faster

RCNN等,此类算法将检测问题分成两个阶段:首先确定候选区域,之后再进行分类识别。但总体来看,采用Faster

RCNN识别目标精度较高,但存在训练时间长,整体模型参数量大,对计算性能要求高等问题,不适用于移动设备的端侧实时检测。
[0006]第二类称为“One

Stage”检测算法,例如YOLO,SSD等,它们是基于回归预测模型,不包含区域建议阶段,经过单次预测得到最终的检测结果。并且从各类SSD检测方案来看,虽然检测速度更快,但SSD检测性能好坏主要取决于特征提取的设计方案,并且对于道路交通拥堵,重叠车辆较多时,目标检测性能比较弱。
[0007]综上所述,在自动驾驶车辆的移动目标识别上,应用YOLO系列模型最为适宜,该模型经过轻量化处理,更便于部署到端侧检测设备。根据网络的宽度以及深度,YOLO提供了YOLOv5s,YOLOv5m,YOLOv5l和YOLOv5x四种网络结构,其中,YOLOv5s是轻量化网络的首选,其结构主要包含输入端,骨干网络,颈部网络,检测层四个部分。尽管YOLOv5s用于图像目标检测的速度较快,但也存在收敛速度慢、误检,误删等问题。

技术实现思路

[0008]针对YOLOv5s对目标识别所存在的问题,本专利技术的主要目的是在YOLOv5s网络的基础上进行改进,提供一种用于自动驾驶车辆的道路多目标快速识别方法,即Target

YOLO网
络模型,可针对汽车,卡车,公交车,人,自行车,摩托车六类移动目标开展识别,为自动驾驶车辆目标识别研究提供理论依据和执行方案。
[0009]本专利技术提供的技术方案包括:分别在YOLOv5s的骨干网络和颈部网络引入注意力机制来测试最佳引入位置;优化骨干网络层提高特征提取能力;改进训练过程,提高模型收敛速度;改进后处理算法避免检测框的误删误检;整合所有改进方案,提出最终的改进模型,即Target

YOLO模型,并通过自动驾驶数据集加以验证。具体涉及方案的步骤如下:
[0010]步骤一、在YOLOv5s的骨干网络和颈部网络这两部分上分别测试CBAM注意力机制的最佳引入位置。
[0011]步骤二、采用Res2Net类残差网络替换骨干网络中的BottleNeck部分,提高多尺度特征提取能力。
[0012]步骤三、采用Varifocal Loss损失函数优化模型的训练过程,加快模型的收敛速度。
[0013]步骤四、采用Soft

NMS软阈值算法替代后处理算法中的NMS硬阈值算法,避免检测框的误删或者误检。
[0014]步骤五、整合以上改进方案,提出“Target

YOLO”目标检测模型并通过自动驾驶图像数据集Target加以验证。
[0015]优选地,步骤一中测试注意力机制引入位置时需要分别在YOLOv5s的骨干网络和颈部网络验证最佳引入位置。具体操作是将CBAM注意力机制引入YOLOv5s网络后,分别通过Target自动驾驶数据集来验证检测结果,选择结果最优的一种注意力机制引入位置。
[0016]优选地,步骤二中是利用Res2Net类残差结构替换掉原始YOLOv5s的骨干网络的BottleNeck层,以此来提升网络模型整体的多尺度特征提取范围,来感知更细粒度的特征信息。
[0017]优选地,步骤三中采用Varifocal Loss损失函数去替换掉目标置信度损失和分类损失所使用的BCE

WithLogits Loss损失函数,在训练过程中去平衡正负样本,以期达到加速收敛速度的效果。
[0018]优选地,步骤四中使用Soft

NMS软阈值算法替换掉NMS硬阈值算法,避免NMS硬阈值算法导致的检测框出现误检误删问题。
[0019]优选地,步骤五中通过对前述步骤中所有改进方案的分析比较,结合所有改进确定出最终的整体改进方案,提出“Target

YOLO”检测模型,并通过自动驾驶图像数据集Target验证模型效果。
[0020]采用上述技术方案所产生的有益效果为:本专利技术提出的Target

YOLO网络通过对原始YOLOv5s的骨干网络层,损失函数以及后处理算法三个方面进行替换优化,结合Res2Net的类残差结构去提高多尺度特征感知范围,利用Varifocal Loss损失函数去平衡训练过程中的正负样本权重,使用Soft

NMS算法替换了原始的NMS算法,并通过引入注意力机制来提高特征融合能力,上述改进综合提升了模型本身的特征提取能力,使其更加有利于对大小多类目标的识别。
附图说明
[0021]图1为本专利技术实施例中Target

YOLO网络结构图;
[0022]图2为本专利技术实施例中原始YOLOv5s网络结构图;
[0023]图3为本专利技术实施例中CBAM注意力机制示意图;
[0024]图4为本专利技术实施例中主干网络注意力机制融合示意图;
[0025]图5为本专利技术实施例中颈部网络注意力机制融合示意图;
[0026]图6为本专利技术实施例中主干网络改进结构图;
[0027]图7为本专利技术实施例中损失函数改进前后对比图;(a)目标置信度损失;(b)目标分类损失
[0028]图8为本专利技术实施例中后处理环节假本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于自动驾驶车辆的道路多目标快速识别方法,其特征在于,该方法包括如下步骤:步骤一、在YOLOv5s的骨干网络和颈部网络这两部分上分别测试CBAM注意力机制的最佳引入位置;步骤二、采用Res2Net类残差网络替换骨干网络中的BottleNeck部分,提高多尺度特征提取能力;步骤三、采用VarifocalLoss损失函数优化模型的训练过程,加快模型的收敛速度;步骤四、采用Soft

NMS软阈值算法替代后处理算法中的NMS硬阈值算法,避免检测框的误删或者误检;步骤五、整合以上改进方案,提出“Target

YOLO”目标检测模型并通过自动驾驶图像数据集Target加以验证。2.根据权利要求1所述的一种用于自动驾驶车辆的道路多目标快速识别方法,其特征在于,步骤一具体为,测试注意力机制引入位置时需要分别在YOLOv5s的骨干网络和颈部网络验证最佳引入位置;具体操作是将CBAM注意力机制引入YOLOv5s网络后,分别通过Target自动驾驶数据集来验证检测结果,选择结果最优的一种注意力机制引入位置。3.根据权利要求1所述的一种用于自动驾驶车辆的道路多目...

【专利技术属性】
技术研发人员:张建宇姚正崇郝腾龙王留震冯梦洁肖勇许文豪
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1