一种类人驾驶轨迹评估与生成的方法技术

技术编号:44332529 阅读:22 留言:0更新日期:2025-02-18 20:41
本发明专利技术涉及自动驾驶类人驾驶的技术领域,具体公开了一种类人驾驶轨迹评估与生成的方法,包括以下步骤:S1、构建驾驶轨迹数据集THAD;S2、基于对比网络构建车辆状态‑轨迹与对应类人等级之间的深层特征映射,训练出精准评估状态‑轨迹类人程度的等级评估器;S3、将所述等级评估器与强化学习结合,利用所述等级评估器为强化学习提供的驾驶奖励信号训练出生成安全、类人驾驶轨迹的轨迹生成器。本发明专利技术通过结合对比网络,在训练强化学习生成轨迹时,能够得到轨迹的类人等级转化的奖励监督信号,不仅避免传统奖励函数中车辆众多参数的精细调整,而且可以使得强化学习生成的轨迹朝类人方向优化。

【技术实现步骤摘要】

本专利技术涉及自动驾驶类人驾驶的,具体是涉及一种类人驾驶轨迹评估与生成的方法


技术介绍

1、类人驾驶技术是自动驾驶领域的一个热点,其目的是通过模拟人的决策,在复杂的交通环境中安全合理地驾驶,实现车辆的自动驾驶。监督学习由于其模式识别和预测的优势,在自动驾驶中得到了广泛的应用。例如,模仿学习就是通过模仿专家的行为来训练自动驾驶系统。然而,在持续的决策过程中,模型可能会发生分布偏移,并且由于过度依赖专家行为产生的结果,而不是做出这些行为的原因,导致因果混淆,导致最终决策错误,影响驾驶安全。

2、与监督学习不同,强化学习是一种通过试错来学习最优策略的方法。在自动驾驶系统中,强化学习通过让模型在模拟或真实环境中不断尝试和调整驾驶策略,以最大化某种奖励函数(如安全性、效率等)为目标,从而学习到最优的驾驶行为。强化学习主要由智能体、环境、状态、动作和奖励五个基本元素组成。智能体在环境中通过执行动作来改变状态,并根据环境的反馈(即奖励)来调整其策略,以最大化长期累积的奖励,这样可以有效地缓解分布偏移,解决因果混淆问题。尽管强化学习可以在复杂任务中取得良好的本文档来自技高网...

【技术保护点】

1.一种类人驾驶轨迹评估与生成的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,步骤S1具体包括以下步骤:

3.根据权利要求2所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,步骤S12中的所述泛化处理过程如下:

4.根据权利要求2所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,所述状态轨迹—等级信息对中包括车辆最终状态信息和最终轨迹信息,所述最终车辆状态信息包含:

5.根据权利要求1所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,步骤S2具体包括以下步骤

6....

【技术特征摘要】

1.一种类人驾驶轨迹评估与生成的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,步骤s1具体包括以下步骤:

3.根据权利要求2所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,步骤s12中的所述泛化处理过程如下:

4.根据权利要求2所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,所述状态轨迹—等级信息对中包括车辆最终状态信息和最终轨迹信息,所述最终车辆状态信息包含:

5.根据权利要求1所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,步骤s2具体包括以下步骤:

6.根据权利要求5所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,所述状态-轨迹特征编码器采用注意力机制以捕捉状态和轨迹的高维特征信息,计算过程为:首先确定车辆状态和轨迹之间的注意力分数:其中q为车辆状态向量,k为轨迹信息向量,dk为缩放因子,用于缩放点积以避免梯度消失或爆炸问题;然后通过应用softmax对所有查询的注意力分数进行归一化处理,得到一组归一化的注意力权重w=softmax(score(q,k));最...

【专利技术属性】
技术研发人员:刘维维刘勇张添硕谢勇袁童节黄涛胡文轩郝祥范丽
申请(专利权)人:浙江大学湖州研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1