一种基于新型动态级联YOLOv8的自动驾驶目标识别方法及装置制造方法及图纸

技术编号：39128255 阅读：8 留言：0更新日期：2023-10-23 14:49

本发明专利技术公开了一种基于新型动态级联YOLOv8的自动驾驶目标识别方法及装置，对预先获取的交通车辆原始图像进行预处理，并划分为训练集和测试集；构建基于新型动态级联YOLOv8的自动驾驶目标识别网络；所述自动驾驶目标识别网络将YOLOv8网络中Backbone主干网整体替换为新型动态级联主干网络；将YOLOv8网络最后一部分中的检测头替换为新跨尺度共享卷积权重的ShareSepHead检测头；采用改进的PolyLoss作为自动驾目标识别网络的损失函数；利用训练集对自动驾驶目标识别网络型进行训练；将测试集输入训练好的自动驾驶目标识别网络，对自动驾驶目标识别网络进行评估。本发明专利技术可以提高自动驾驶中目标的识别精度及速度，为自动驾驶的安全提供保障。安全提供保障。安全提供保障。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于新型动态级联YOLOv8的自动驾驶目标识别方法及装置

[0001]本专利技术属于深度学习在计算机视觉领域的应用，具体涉及一种基于新型动态级联YOLOv8的自动驾驶目标识别方法及装置。

技术介绍

[0002]作为计算机视觉核心问题之一的目标检测，旨在找出图像中特定目标的类别和位置，现已广泛应用于各个领域，如自动驾驶、遥感图像、视频监控以及医疗检测等。
[0003]YOLO发展自从2016年起，不断版本更新，至今已到v8。2016年，以YOLOv1为代表的单阶段(One
‑
Stage)目标检测方法出现。纵观单阶段目标检测方法的发展历程可以发现，从首个单阶段目标检测方法YOLOv1提出至2023年的YOLOv8，YOLO系列的目标检测方法伴随着单阶段目标检测的发展而发展，已经成为One
‑
Stage方法的典型代表。
[0004]虽然YOLOv8在处理简单图象时可以很快地进行目标检测，但当面对复杂场景，例如现实中遇到交通拥堵时，存在大量的车辆和行人时，需要更多的时间来进行检测。自动驾驶地实时性对于决策至关重要，处理速度的提升依旧有待提高。还有是准度地提升，自动驾驶需要高度准确的目标检测结果，以确保对于各种交通状况做出正确的反应。虽然YOLOv8可能在一些场景下有较好的表现，但在一些交通复杂的情况下，检测精度还有待提高。现有技术YOLOv8的backbone主干网在处理简单图像时很快，但遇到目标很多的复杂图像时需要更多的时间；现有YOLOv8的检测头部模型包含较多的参...

【技术保护点】

【技术特征摘要】
1.一种基于新型动态级联YOLOv8的自动驾驶目标识别方法，其特征在于，包括以下步骤：(1)对预先获取的交通车辆原始图像进行预处理，并划分为训练集和测试集；(2)构建基于新型动态级联YOLOv8的自动驾驶目标识别网络；所述自动驾驶目标识别网络将YOLOv8网络中Backbone主干网整体替换为新型动态级联主干网络；将YOLOv8网络最后一部分中的检测头替换为新跨尺度共享卷积权重的ShareSepHead检测头；(3)采用改进的PolyLoss作为自动驾目标识别网络的损失函数；(4)利用训练集对自动驾驶目标识别网络型进行训练；(5)将测试集输入训练好的自动驾驶目标识别网络，对自动驾驶目标识别网络进行评估。2.根据权利要求1所述的一种基于新型动态级联YOLOv8的自动驾驶目标识别方法，其特征在于，步骤(2)所述新型动态级联主干网，拥有两个级联主干网络，并在两个主干网络之间插入动态路由器来自动为每个待检测图像选择最佳路线；待检测图像将经过第一个主干网络提取第一级多尺度特征，并将该多尺度特征送入动态路由器评判该图像难易程度；通过两个线性映射层将特征映射到难易评分；若判别为“简单”图像，则第一级多尺度特征将送入YOLOv8的head部分；若判别为“困难”图像，则待检测图像及其第一级多尺度特征将被送入第二个主干网络，提取获得第二级多尺度特征，送入YOLOv8的head部分。3.根据权利要求1所述的一种基于新型动态级联YOLOv8的自动驾驶目标识别方法，其特征在于，步骤(2)所述新型动态级联主干网络实现过程如下：对于输入图像x，首先提取其多尺度特征F1，第一主干B1为：式中，L为阶段数，即多尺度特征数；然后，路由器R将使用这些多尺度特征F1来预测该图像的难度分数φ∈(0,1)为：如果路由器将输入的图像分类为“简单”图像，那么紧随其后的颈部头部D1将输出检测结果y为：如果路由器将输入图像分类为“复杂”图像，则多尺度特征将需要第二主干进一步增强，通过一个复合连接模块G将多尺度特征F1嵌入到H中：其中，G是实现CBNet的DHLC；将输入图像x送入第二主干，通过对嵌入的H在每一阶段对应的元素依次求和来增强第二主干的特征，记为：检测结果，第二次的头颈部D2解码为：y＝D2(F1)。4.根据权利要求1所述的一种基于新型动态级联YOLOv8的自...

【专利技术属性】
技术研发人员：洪远，姜明新，杜强，黄俊闻，项靖，王杰，
申请(专利权)人：淮阴工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人