System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于Transformer的自动驾驶路径优化方法技术_技高网

一种基于Transformer的自动驾驶路径优化方法技术

技术编号:40943749 阅读:4 留言:0更新日期:2024-04-18 15:00
本发明专利技术提出了一种基于Transformer的自动驾驶路径优化方法。本发明专利技术采用ACT网络进行障碍物目标的实时识别,并通过RRT*算法和贝塞尔曲线的优化拟合行车路线,实现自动驾驶的路径规划及优化。本发明专利技术采用ACT网络作为骨干网络,有效增强了特征提取能力。这对于在复杂道路环境中精确地识别障碍物至关重要。通过使用Bi‑LSTM网络对时间序列进行建模,本发明专利技术能够更有效地处理障碍物目标检测中的动态变化,如移动的车辆或行人,从而提高检测的准确性。结合RRT*算法和贝塞尔曲线进行路径规划,本发明专利技术不仅提高了路径规划的准确性,还能生成更平滑、更适合实际驾驶的路径,从而增强了自动驾驶车辆的安全性和舒适性。

【技术实现步骤摘要】

本专利技术涉及自动驾驶领域,更具体地说是一种基于transformer的自动驾驶路径优化方法。


技术介绍

1、随着人工智能技术的发展,无人驾驶汽车逐渐从愿景走向现实。自动驾驶路线预测作为无人驾驶汽车中的关键技术之一,需要通过对车辆周围环境和交通情况进行分析和识别,预测出车辆未来的行驶路线,以帮助车辆做出正确的决策。在实际中的道路场景环境复杂,存在着各种障碍物,当自动驾驶路线预测拟合出现误差时,车辆可能会撞到各种障碍物从而引发事故。因此,更优的障碍物检测和路线拟合能力,可以帮助车辆安全平滑的行驶。

2、传统目标检测需要借助前景目标的颜色、纹理和边缘等特征,进行定位和分类,如sift(scale-invariant feature transform)。但传统方法,会受数据复杂、光照变化、天气等环境影响,以及实时性较差等缺点。随着近几年基于深度学习的目标检测算法已被广泛使用。其方法大致可以分成两类:第一类为两阶段检测算法,主要以faster r-cnn模型为代表;第二类是单阶段检测算法,主要以yolo和ssd为例。在两阶段方法中首先通过rpn生成一系列候选框,然后使用对应的网络进行特征提取和分类。两阶段检测算法具有较高的检测精度,但检测效率不高;由于单阶段检测算法只需要在完成分类或者回归任务前提取单个特征,所以检测速度快,但检测精度不如两阶段目标检测算法。


技术实现思路

1、为了克服现有技术的上述缺陷,本专利技术提供一种基于transformer的自动驾驶路径优化方法。p>

2、本专利技术旨在:

3、提高障碍物检测的准确率和效率:智能车在行驶过程中需识别障碍物并进行路线规划。然而,现有技术中,障碍物可能因被遮挡、视觉偏差、光照等问题而导致误识别。本专利技术通过采用transformer的注意力机制,提升了障碍物识别的准确率和效率。

4、解决目标检测的实时性和精确性问题:传统目标检测方法容易受到环境因素的影响,且实时性较差。而基于深度学习的目标检测算法,如faster r-cnn和yolo,虽有所改进,但两阶段算法检测效率不高,单阶段算法检测精度不足。本专利技术旨在通过结合深度学习和transformer技术,解决这些问题。

5、优化路径规划,减少规划时间,提高路径平滑性:现有的路径规划算法,如rrt*,尽管在高维空间中减少了搜索时间,但规划出的路径可能存在不平滑的问题。本专利技术通过结合rrt*算法和贝塞尔曲线,旨在优化路径规划,使得路径更加平滑且高效。

6、提高复杂环境下的自动驾驶性能和安全性:在复杂的道路环境中,正确预测行驶路线对于避免事故至关重要。本专利技术提出的方法通过更优的障碍物检测和路线拟合能力,旨在帮助车辆在复杂环境中安全、平滑地行。

7、本专利技术采用act作为骨干网络,以增强特征提取能力,同时使用bi-lstm网络对时间序列进行建模以完成障碍物目标检测,最后使用融合rrt*算法和贝塞尔曲线进行自动驾驶路线预测,建立了一种基于transformer的自动驾驶路径优化方法。

8、本专利技术技术方案如下:

9、一种基于transformer的自动驾驶路径优化方法,包括以下步骤:

10、步骤1:启动程序后,通过摄像头录取真实世界影像;

11、步骤2:对视频帧文件进行预处理;

12、步骤3:将预处理过的视频帧文件输入act对输入序列进行标记,然后将其生成的标记序列馈送到解码器以生成输出序列;

13、步骤4:将输出序列输入到bi-lstm网络建模视频帧中的时序特征;

14、步骤5:将输出序列输入到act解码器,后将输出结果输出到fnn分类器中完成对应障碍物的目标识别,并返回对应障碍物的位置信息;

15、步骤6:根据步骤五中的输出信息,采用rtt算法生成折线路径;

16、步骤7:采用贝塞尔曲线拟合算法对折线路径进行曲线拟合并输出得到最终路径。

17、本专利技术的技术效果和优点:

18、增强的特征提取能力:本专利技术采用act网络作为骨干网络,有效增强了特征提取能力。这对于在复杂道路环境中精确地识别障碍物至关重要。

19、有效的时间序列建模:通过使用bi-lstm网络对时间序列进行建模,本专利技术能够更有效地处理障碍物目标检测中的动态变化,如移动的车辆或行人,从而提高检测的准确性。

20、精确且高效的路径规划:结合rrt*算法和贝塞尔曲线进行路径规划,本专利技术不仅提高了路径规划的准确性,还能生成更平滑、更适合实际驾驶的路径,从而增强了自动驾驶车辆的安全性和舒适性。

21、高效的预测网络设计:预测网络采用核为1×1的2d卷积网络直接输出预测结果,使得模型能够高效地处理大量数据,同时保持了较高的预测准确性。

22、优化的训练过程:在模型训练过程中,采用riou损失函数,使得训练过程更加高效,提高了模型的总体性能。

本文档来自技高网...

【技术保护点】

1.一种基于Transformer的自动驾驶路径优化方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于Transformer的自动驾驶路径优化方法,其特征在于:所述步骤1中,采用VideoCapture函数调用摄像头组件对现实世界进行视频影像的捕捉和采集。

3.根据权利要求1所述的一种基于Transformer的自动驾驶路径优化方法,其特征在于:所述步骤2中,采用按帧截取的方式以及Min-Max归一化方法对视频的每一帧影像进行预处理;

4.根据权利要求1所述的一种基于Transformer的自动驾驶路径优化方法,其特征在于:所述步骤4中,Bi-LSTM网络由三个门和一个存储单元组成,用来保存每个神经元的状态,三个门即一个输入门、一个遗忘门和一个输出门;标准的LSTM只能利用序列的历史信息,是单方向的特征,由于视觉特征的复杂性,还需要考虑未来信息;

5.根据权利要求1所述的一种基于Transformer的自动驾驶路径优化方法,其特征在于:所述步骤5中,步骤3、步骤5提到的ACT网络架构中,编码器使用imagenet预训练的ResNet模型从输入图像中提取2D特征;位置编码模块使用不同频率的正弦和余弦函数对空间信息进行编码;DETR将2D特征扁平化,并用位置编码补充它们,并将它们传递给6层变压器编码器;编码器各层结构相同,包括8头自关注模块和FFN模块;然后,解码器将少量固定数量的学习到的位置嵌入作为输入,并额外关注编码器的输出;解码器也有6层,每层包含一个8头自注意模块、一个8头共注意模块和一个FFN模块;最后,ACT将解码器的每个输出传递给一个共享前馈网络,该网络预测检测或“无对象”类;

6.根据权利要求1所述的一种基于Transformer的自动驾驶路径优化方法,其特征在于:所述步骤6中,RRT算法是一种基于采样的方法,旨在快速的找到一条从起点到终点的拟合路线;RRT*算法是对RRT算法的改进,具体说来,选择AUV的初始位置为χinit,将其作为根节点构建一棵搜索树,然后在空间进行采样获得χrand,并利用欧氏距离在随机树上寻找距离χrand最近的节点χnear,以Stepsize扩展得到新节点χnew,如果在这个过程中没有发生碰撞,则重新规划直到找到使得代价值最小的点χmin,并添加到随机树上;将上述过程不断进行迭代运行,进而优化路径。

7.根据权利要求1所述的一种基于Transformer的自动驾驶路径优化方法,其特征在于:所述步骤7中,贝塞尔曲线是一种连续的平滑曲线,具有曲率连续、控制简单等特点,广泛应用于智能驾驶路径规划等领域;由于高阶贝塞尔曲线的数值稳定性较差,因此本文使用三阶贝塞尔曲线进行预测路线平滑优化,可以做到改变车辆位置但不改变车辆在曲线起、终点的速度方向,因此能够很好的用在智能车自动驾驶路线预测上;三阶贝塞尔曲线表达式如公式(8)所示:

8.根据权利要求1所述的一种基于Transformer的自动驾驶路径优化方法,其特征在于:使用ACT网络作为主干网络;采用核为1×1的2D卷积网络作为预测网络,直接输出预测结果;主干网络的窗口设置为13×13,多头注意力头的数量分别为4、8、16和32;模型再训练过程中的损失函数选择使用RIoU进行计算。

...

【技术特征摘要】

1.一种基于transformer的自动驾驶路径优化方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于transformer的自动驾驶路径优化方法,其特征在于:所述步骤1中,采用videocapture函数调用摄像头组件对现实世界进行视频影像的捕捉和采集。

3.根据权利要求1所述的一种基于transformer的自动驾驶路径优化方法,其特征在于:所述步骤2中,采用按帧截取的方式以及min-max归一化方法对视频的每一帧影像进行预处理;

4.根据权利要求1所述的一种基于transformer的自动驾驶路径优化方法,其特征在于:所述步骤4中,bi-lstm网络由三个门和一个存储单元组成,用来保存每个神经元的状态,三个门即一个输入门、一个遗忘门和一个输出门;标准的lstm只能利用序列的历史信息,是单方向的特征,由于视觉特征的复杂性,还需要考虑未来信息;

5.根据权利要求1所述的一种基于transformer的自动驾驶路径优化方法,其特征在于:所述步骤5中,步骤3、步骤5提到的act网络架构中,编码器使用imagenet预训练的resnet模型从输入图像中提取2d特征;位置编码模块使用不同频率的正弦和余弦函数对空间信息进行编码;detr将2d特征扁平化,并用位置编码补充它们,并将它们传递给6层变压器编码器;编码器各层结构相同,包括8头自关注模块和ffn模块;然后,解码器将少量固定数量的学习到的位置嵌入作为输入,并额外关注编码器的输出;解码器也有6层,每层包含一个8头自注意模块、一个8头共注意模块和一个ffn模块;最后,act将...

【专利技术属性】
技术研发人员:何嘉琦田原邱彭湃王乐洋王浩琰
申请(专利权)人:联轮科技武汉有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1