【技术实现步骤摘要】
本专利技术涉及车辆,尤其涉及一种车辆变道决策模型训练方法和一种车辆变道决策方法。
技术介绍
1、自动驾驶车辆为了遵循既定的行驶路线,或超过前方较慢的车辆等场景都需要通过变道操作来完成自动驾驶任务,往往不恰当的变道行为会导致交通拥堵甚至发生车祸。
2、现有研究虽然已经提出了许多基于规则的方法来解决自动驾驶变道问题,但由于驾驶环境的不确定性和复杂性,它们往往表现出有限的性能。目前针对自动驾驶变道决策的主流做法是,通过制定规则的方式定义出不同的场景,在不同的场景下制定不同换道算法及参数,根据探测到的车道信息及交通参与体的信息,在保证前后车安全距离的前提下快速、平稳的变换到目标车道。
3、但现实中换道的场景不可能完全被建模,车辆遇到没有定义的场景或是复杂场景的时候,便无法合理选择车速和变道时机甚至出现碰撞危险。而仅基于强化学习的方法虽然通用性较强,但需要在与真实环境相似的仿真环境下进行大量的训练,需要花费大量的时间才能获得一个比较成熟的模型;同时对硬件系统的性能要求较高,实现同样性能往往需要花费更高的成本。
/>技术本文档来自技高网...
【技术保护点】
1.一种车辆变道决策模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述目标交通参与者包括:原车道上与所述自车距离最近的第一前方车辆和第一后方车辆,目标车道上与所述自车时距最近的第二前方车辆和第二后方车辆,所述时距为所述自车追上前方车辆的用时,或后方车辆追上所述自车的用时;所述行驶状态信息包括所述自车和各个所述目标交通参与者的当前速度信息、加速度信息、坐标信息和方向角信息;所述根据所述行驶状态信息构建马尔科夫决策模型在当前时刻的状态矩阵,包括:
3.根据权利要求1所述的方法,其特征在于,所述行为结果信息包括:
...【技术特征摘要】
1.一种车辆变道决策模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述目标交通参与者包括:原车道上与所述自车距离最近的第一前方车辆和第一后方车辆,目标车道上与所述自车时距最近的第二前方车辆和第二后方车辆,所述时距为所述自车追上前方车辆的用时,或后方车辆追上所述自车的用时;所述行驶状态信息包括所述自车和各个所述目标交通参与者的当前速度信息、加速度信息、坐标信息和方向角信息;所述根据所述行驶状态信息构建马尔科夫决策模型在当前时刻的状态矩阵,包括:
3.根据权利要求1所述的方法,其特征在于,所述行为结果信息包括:当前所处车道、从执行变道任务前到变道任务结束后的加速度变化值、当前车速、与当前车道内的最近交通参与者的距离;所述根据所述行为结果信息和预设的奖励函数确定本次变道任务的奖励得分,包括:
4.根据权利要求1所述的方法,其特征在于,在获取所述自车的行为结果信息之前,还包括:确定所述变道任务是否结束;
...【专利技术属性】
技术研发人员:卜祥津,张光肖,
申请(专利权)人:中汽创智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。