【技术实现步骤摘要】
本专利技术涉及自动驾驶类人驾驶的,具体是涉及一种类人驾驶轨迹评估与生成的方法。
技术介绍
1、类人驾驶技术是自动驾驶领域的一个热点,其目的是通过模拟人的决策,在复杂的交通环境中安全合理地驾驶,实现车辆的自动驾驶。监督学习由于其模式识别和预测的优势,在自动驾驶中得到了广泛的应用。例如,模仿学习就是通过模仿专家的行为来训练自动驾驶系统。然而,在持续的决策过程中,模型可能会发生分布偏移,并且由于过度依赖专家行为产生的结果,而不是做出这些行为的原因,导致因果混淆,导致最终决策错误,影响驾驶安全。
2、与监督学习不同,强化学习是一种通过试错来学习最优策略的方法。在自动驾驶系统中,强化学习通过让模型在模拟或真实环境中不断尝试和调整驾驶策略,以最大化某种奖励函数(如安全性、效率等)为目标,从而学习到最优的驾驶行为。强化学习主要由智能体、环境、状态、动作和奖励五个基本元素组成。智能体在环境中通过执行动作来改变状态,并根据环境的反馈(即奖励)来调整其策略,以最大化长期累积的奖励,这样可以有效地缓解分布偏移,解决因果混淆问题。尽管强化学习可以在
...【技术保护点】
1.一种类人驾驶轨迹评估与生成的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,步骤S1具体包括以下步骤:
3.根据权利要求2所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,步骤S12中的所述泛化处理过程如下:
4.根据权利要求2所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,所述状态轨迹—等级信息对中包括车辆最终状态信息和最终轨迹信息,所述最终车辆状态信息包含:
5.根据权利要求1所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,步骤S2具体包括以下步骤
6....
【技术特征摘要】
1.一种类人驾驶轨迹评估与生成的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,步骤s1具体包括以下步骤:
3.根据权利要求2所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,步骤s12中的所述泛化处理过程如下:
4.根据权利要求2所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,所述状态轨迹—等级信息对中包括车辆最终状态信息和最终轨迹信息,所述最终车辆状态信息包含:
5.根据权利要求1所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,步骤s2具体包括以下步骤:
6.根据权利要求5所述的一种类人驾驶轨迹评估与生成的方法,其特征在于,所述状态-轨迹特征编码器采用注意力机制以捕捉状态和轨迹的高维特征信息,计算过程为:首先确定车辆状态和轨迹之间的注意力分数:其中q为车辆状态向量,k为轨迹信息向量,dk为缩放因子,用于缩放点积以避免梯度消失或爆炸问题;然后通过应用softmax对所有查询的注意力分数进行归一化处理,得到一组归一化的注意力权重w=softmax(score(q,k));最...
【专利技术属性】
技术研发人员:刘维维,刘勇,张添硕,谢勇,袁童节,黄涛,胡文轩,郝祥,范丽,
申请(专利权)人:浙江大学湖州研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。