当前位置: 首页 > 专利查询>燕山大学专利>正文

考虑周围车辆社会偏好的自动驾驶行为决策系统技术方案

技术编号:41326772 阅读:49 留言:0更新日期:2024-05-13 15:04
本发明专利技术涉及一种考虑周围车辆社会偏好的自动驾驶行为决策系统,用于解决现有交通环境中因驾驶员社会偏好具有不确定性而导致自动驾驶决策困难的问题。本方案采用分层强化学习实现自动驾驶行为决策,其元控制器利用自主车辆的历史状态进行保持车道继续行驶、换道或返回原车道决策选择;其中返回原车道为自主车辆通过中断换道实现,中断条件为其刚开始换道或在换道过程中车身边缘刚接触目标车道邻侧车道线时,根据当前时刻状态识别出目标车道后方车辆社会偏好类型为利己型;控制器为基于状态历史信息,进行自主车辆在本车道或者邻车道中心线上的目标轨迹采样点规划;元控制器和控制器采用相同的包括基于周围车辆的社会偏好进行目标决策的奖励计算。

【技术实现步骤摘要】

本专利技术涉及多车道自动驾驶车辆的行为决策,尤其涉及一种考虑周围车辆社会偏好的自动驾驶行为决策系统


技术介绍

1、相较于驾驶风格的相对稳定性,在交互式驾驶场景中不足以体现驾驶人因心情、心态等某些可变因素,而可能发生的社会价值取向临时变化,因此引入了心理学中的“社会偏好”,根据社会心理学的定义,社会偏好是指人与生俱来的社会性在偏好层面的体现。根据驾驶员社会价值取向的偏好差异性,可将周围车辆驾驶员不同的社会价值取向分为利己性、互惠性和利他性三种类型。

2、在面对周围车辆存在社会偏好不确定性的动态场景,基于规则的自动驾驶行为决策设计较为困难,基于社会偏好与博弈算法结合、基于驾驶风格与换道规则变道结合等方案,这些预定义的规则不能涵盖交互场景中的所有可能情况。而基于强化学习(rl)的行为决策技术,通过自主车辆(agent)与环境(env)的不断交互产生奖励(reward),利用reward不断改善agent策略,虽然可以在一定程度上提升自动驾驶在交互驾驶场景中的性能,但由于交互驾驶场景中不确定性的因素,经典的rl行为决策算法面临奖励稀疏、训练强度大、空本文档来自技高网...

【技术保护点】

1.一种考虑周围车辆社会偏好的自动驾驶行为决策系统,其特征在于:

2.根据权利要求1所述的系统,其特征在于,周围车辆的社会偏好类型的识别机制根据工况不同,具体为:

3.根据权利要求1所述的系统,其特征在于:

4.根据权利要求2所述的系统,其特征在于:

5.根据权利要求2所述的系统,其特征在于:

6.根据权利要求2所述的系统,其特征在于:

7.根据权利要求2所述的系统,其特征在于:

8.根据权利要求1所述的系统,其特征在于,自主车辆的当前行车状况包括:纵向速度、横向速度、偏航角、自主车辆车道标识。

<...

【技术特征摘要】

1.一种考虑周围车辆社会偏好的自动驾驶行为决策系统,其特征在于:

2.根据权利要求1所述的系统,其特征在于,周围车辆的社会偏好类型的识别机制根据工况不同,具体为:

3.根据权利要求1所述的系统,其特征在于:

4.根据权利要求2所述的系统,其特征在于:

5.根据权利要求2所述的系统,其特征在于:

6.根据权利要求2所述的系统,其特征在于:

7.根据权利要求2所述的系统,其特征在于:

...

【专利技术属性】
技术研发人员:金立生韩广德谢宪毅郭柏苍贺阳刘国峰朱文涛王欢欢霍震孙鑫宇
申请(专利权)人:燕山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1