当前位置: 首页 > 专利查询>淮阴工学院专利>正文

一种基于新型动态级联YOLOv8的自动驾驶目标识别方法及装置制造方法及图纸

技术编号:39128255 阅读:8 留言:0更新日期:2023-10-23 14:49
本发明专利技术公开了一种基于新型动态级联YOLOv8的自动驾驶目标识别方法及装置,对预先获取的交通车辆原始图像进行预处理,并划分为训练集和测试集;构建基于新型动态级联YOLOv8的自动驾驶目标识别网络;所述自动驾驶目标识别网络将YOLOv8网络中Backbone主干网整体替换为新型动态级联主干网络;将YOLOv8网络最后一部分中的检测头替换为新跨尺度共享卷积权重的ShareSepHead检测头;采用改进的PolyLoss作为自动驾目标识别网络的损失函数;利用训练集对自动驾驶目标识别网络型进行训练;将测试集输入训练好的自动驾驶目标识别网络,对自动驾驶目标识别网络进行评估。本发明专利技术可以提高自动驾驶中目标的识别精度及速度,为自动驾驶的安全提供保障。安全提供保障。安全提供保障。

【技术实现步骤摘要】
一种基于新型动态级联YOLOv8的自动驾驶目标识别方法及装置


[0001]本专利技术属于深度学习在计算机视觉领域的应用,具体涉及一种基于新型动态级联YOLOv8的自动驾驶目标识别方法及装置。

技术介绍

[0002]作为计算机视觉核心问题之一的目标检测,旨在找出图像中特定目标的类别和位置,现已广泛应用于各个领域,如自动驾驶、遥感图像、视频监控以及医疗检测等。
[0003]YOLO发展自从2016年起,不断版本更新,至今已到v8。2016年,以YOLOv1为代表的单阶段(One

Stage)目标检测方法出现。纵观单阶段目标检测方法的发展历程可以发现,从首个单阶段目标检测方法YOLOv1提出至2023年的YOLOv8,YOLO系列的目标检测方法伴随着单阶段目标检测的发展而发展,已经成为One

Stage方法的典型代表。
[0004]虽然YOLOv8在处理简单图象时可以很快地进行目标检测,但当面对复杂场景,例如现实中遇到交通拥堵时,存在大量的车辆和行人时,需要更多的时间来进行检测。自动驾驶地实时性对于决策至关重要,处理速度的提升依旧有待提高。还有是准度地提升,自动驾驶需要高度准确的目标检测结果,以确保对于各种交通状况做出正确的反应。虽然YOLOv8可能在一些场景下有较好的表现,但在一些交通复杂的情况下,检测精度还有待提高。现有技术YOLOv8的backbone主干网在处理简单图像时很快,但遇到目标很多的复杂图像时需要更多的时间;现有YOLOv8的检测头部模型包含较多的参数,导致计算复杂度较高。在自动驾驶系统中,计算资源有限的,因此需要更高效的模型设计,以保证在嵌入式或资源受限的环境下实现目标检测。

技术实现思路

[0005]专利技术目的:本专利技术提出一种基于新型动态级联YOLOv8的自动驾驶目标识别方法及装置,能在自动驾驶中进行准确的目标检测。
[0006]技术方案:本专利技术提出一种基于新型动态级联YOLOv8的自动驾驶目标识别方法,具体包括以下步骤:
[0007](1)对预先获取的交通车辆原始图像进行预处理,并划分为训练集和测试集;
[0008](2)构建基于新型动态级联YOLOv8的自动驾驶目标识别网络;所述自动驾驶目标识别网络将YOLOv8网络中Backbone主干网整体替换为新型动态级联主干网络;将YOLOv8网络最后一部分中的检测头替换为新跨尺度共享卷积权重的ShareSepHead检测头;
[0009](3)采用改进的PolyLoss作为自动驾目标识别网络的损失函数;
[0010](4)利用训练集对自动驾驶目标识别网络型进行训练;
[0011](5)将测试集输入训练好的自动驾驶目标识别网络,对自动驾驶目标识别网络进行评估。
[0012]进一步地,步骤(2)所述新型动态级联主干网,拥有两个级联主干网络,并在两个
主干网络之间插入动态路由器来自动为每个待检测图像选择最佳路线;待检测图像将经过第一个主干网络提取第一级多尺度特征,并将该多尺度特征送入动态路由器评判该图像难易程度;通过两个线性映射层将特征映射到难易评分;若判别为“简单”图像,则第一级多尺度特征将送入YOLOv8的head部分;若判别为“困难”图像,则待检测图像及其第一级多尺度特征将被送入第二个主干网络,提取获得第二级多尺度特征,送入YOLOv8的head部分。
[0013]进一步地,步骤(2)所述新型动态级联主干网络实现过程如下:
[0014]对于输入图像x,首先提取其多尺度特征F1,第一主干B1为:
[0015][0016]式中,L为阶段数,即多尺度特征数;然后,路由器R将使用这些多尺度特征F1来预测该图像的难度分数φ∈(0,1)为:
[0017][0018]如果路由器将输入的图像分类为“简单”图像,那么紧随其后的颈部头部D1将输出检测结果y为:
[0019][0020]如果路由器将输入图像分类为“复杂”图像,则多尺度特征将需要第二主干进一步增强,通过一个复合连接模块G将多尺度特征F1嵌入到H中:
[0021][0022]其中,G是实现CBNet的DHLC;将输入图像x送入第二主干,通过对嵌入的H在每一阶段对应的元素依次求和来增强第二主干的特征,记为:
[0023][0024]检测结果,第二次的头颈部D2解码为:
[0025]y=D2(F1)。
[0026]进一步地,步骤(2)所述ShareSepHead检测头为在不同层之间共享卷积权重,独立计算BN的统计量;所述ShareSepHead包括依次连接的第一卷积层、第一深度可分离卷积层、第二深度可分离卷积层、第二卷积层和BN归一化层。
[0027]进一步地,所述第一卷积层是一个3x3的卷积层,将输入特征图的通道数从x变为c2*2;第一深度可分离卷积层首先对每个输入通道分别应用卷积操作,然后对通道之间的特征进行组合;第二深度可分离卷积层将输入特征图的通道数从c2减少到c2;第二卷积层是1*1卷积层,将输入特征图的通道数从c2变为4*self.reg_max;每个检测头经过BN归一化改善梯度传播与训练速度,BN归一化通过对每个小批次的数据进行归一化处理。
[0028]进一步地,步骤(3)所述改进的PolyLoss包括组合损失函数和加权二元交叉熵损失;PolyLoss将二元交叉熵损失和Focal Loss组合在一起,通过调节损失函数的权重和形状来提高困难样本和正负样本之间的平衡处理能力;使用加权二元交叉熵损失计算预测结果与真实标签之间的二元交叉熵损失,衡量预测与真实标签的匹配程度;引入alpha_factor对损失进行加权,使正样本和负样本的损失在计算中得到不同程度的调整;入了多项式调整因子,用于增加样本概率预测的不确定性。
[0029]进一步地,所述“简单”图像为单一目标图像;所述“困难”图像为两种及两种以上
的目标图像。
[0030]基于相同的专利技术构思,本专利技术提出一种装置设备,包括存储器和处理器,其中:
[0031]存储器,用于存储能够在处理器上运行的计算机程序;
[0032]处理器,用于在运行所述计算机程序时,执行如上所述的基于新型动态级联YOLOv8的自动驾驶目标识别方法步骤。
[0033]基于相同的专利技术构思,本专利技术提出一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被至少一个处理器执行时实现如上所述的基于新型动态级联YOLOv8的自动驾驶目标识别方法步骤。
[0034]有益效果:与现有技术相比,本专利技术的有益效果:本专利技术构建的基于新型动态级联YOLOv8的自动驾驶目标识别网络使得YOLOv8主干网络对不同难度的输入图像自适应的选择推理路线,提高提取特征效率;为提高YOLOv8检测精度,使用全新改进的PolyLoss损失函数,简化超参数搜索空间,调整了多项式系数;为升级YOLOv8检测头,更省参数量,更加高效,提高精度,使用新颖的共享检测头,以增强模型能力获得更高本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于新型动态级联YOLOv8的自动驾驶目标识别方法,其特征在于,包括以下步骤:(1)对预先获取的交通车辆原始图像进行预处理,并划分为训练集和测试集;(2)构建基于新型动态级联YOLOv8的自动驾驶目标识别网络;所述自动驾驶目标识别网络将YOLOv8网络中Backbone主干网整体替换为新型动态级联主干网络;将YOLOv8网络最后一部分中的检测头替换为新跨尺度共享卷积权重的ShareSepHead检测头;(3)采用改进的PolyLoss作为自动驾目标识别网络的损失函数;(4)利用训练集对自动驾驶目标识别网络型进行训练;(5)将测试集输入训练好的自动驾驶目标识别网络,对自动驾驶目标识别网络进行评估。2.根据权利要求1所述的一种基于新型动态级联YOLOv8的自动驾驶目标识别方法,其特征在于,步骤(2)所述新型动态级联主干网,拥有两个级联主干网络,并在两个主干网络之间插入动态路由器来自动为每个待检测图像选择最佳路线;待检测图像将经过第一个主干网络提取第一级多尺度特征,并将该多尺度特征送入动态路由器评判该图像难易程度;通过两个线性映射层将特征映射到难易评分;若判别为“简单”图像,则第一级多尺度特征将送入YOLOv8的head部分;若判别为“困难”图像,则待检测图像及其第一级多尺度特征将被送入第二个主干网络,提取获得第二级多尺度特征,送入YOLOv8的head部分。3.根据权利要求1所述的一种基于新型动态级联YOLOv8的自动驾驶目标识别方法,其特征在于,步骤(2)所述新型动态级联主干网络实现过程如下:对于输入图像x,首先提取其多尺度特征F1,第一主干B1为:式中,L为阶段数,即多尺度特征数;然后,路由器R将使用这些多尺度特征F1来预测该图像的难度分数φ∈(0,1)为:如果路由器将输入的图像分类为“简单”图像,那么紧随其后的颈部头部D1将输出检测结果y为:如果路由器将输入图像分类为“复杂”图像,则多尺度特征将需要第二主干进一步增强,通过一个复合连接模块G将多尺度特征F1嵌入到H中:其中,G是实现CBNet的DHLC;将输入图像x送入第二主干,通过对嵌入的H在每一阶段对应的元素依次求和来增强第二主干的特征,记为:检测结果,第二次的头颈部D2解码为:y=D2(F1)。4.根据权利要求1所述的一种基于新型动态级联YOLOv8的自...

【专利技术属性】
技术研发人员:洪远姜明新杜强黄俊闻项靖王杰
申请(专利权)人:淮阴工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1