当前位置: 首页 > 专利查询>清华大学专利>正文

适用于高速与环路交通场景的长时域驾驶行为决策方法技术

技术编号:35262305 阅读:32 留言:0更新日期:2022-10-19 10:22
本申请涉及车辆技术领域,特别涉及一种适用于高速与环路交通场景的长时域驾驶行为决策方法,包括:获取自车的全局规划路径、自车的当前运动状态和区域内所有周围车辆的当前运动状态;根据全局规划路径、自车的当前运动状态和区域内所有周围车辆的当前运动状态生成自车的最优驾驶行为序列;基于最优驾驶行为序列的第一个驾驶行为规划自车的行驶轨迹,并在控制自车基于行驶轨迹执行第一个驾驶行为之后,重新生成最优驾驶行为序列,直到完成全局规划路径。由此,本申请实施例可以实现换道间隙选择与变道超越等驾驶行为的多步决策,具有前瞻性;同时基于可行性判别,给出对长时域驾驶行为序列规划的最优解,兼顾安全与高效,满足一般驾驶的需要。足一般驾驶的需要。足一般驾驶的需要。

【技术实现步骤摘要】
适用于高速与环路交通场景的长时域驾驶行为决策方法


[0001]本申请涉及车辆
,特别涉及一种适用于高速与环路交通场景的长时域驾驶行为决策方法。

技术介绍

[0002]驾驶决策一般分为全局路径规划(车道级)、驾驶行为规划(换道、避让等语义驾驶行为)及运动轨迹规划(目标驾驶行为的具体运动轨迹)。
[0003]传统行为规划方法以单步规划为主,具有较为短视的缺点,无法规划多行为序列以实现更长期的最优驾驶。而以高速公路场景为例,长时域行为决策的难点,在于在决策过程中需融合对周车的交互行为预测,并实现复杂决策问题的实时求解。

技术实现思路

[0004]本申请提供一种适用于高速与环路交通场景的长时域驾驶行为决策方法、装置、车辆及存储介质,可以实现换道间隙选择与变道超越等驾驶行为的多步决策,具有前瞻性;同时基于可行性判别,给出对长时域驾驶行为序列规划的最优解,兼顾安全与高效,满足一般驾驶的需要。
[0005]本申请第一方面实施例提供一种适用于高速与环路交通场景的长时域驾驶行为决策方法,包括以下步骤:获取自车的全局规划路径、所述自车的当前运动状态和区域内所有周围车辆的当前运动状态;根据所述全局规划路径、所述自车的当前运动状态和区域内所有周围车辆的当前运动状态生成所述自车的最优驾驶行为序列;基于所述最优驾驶行为序列的第一个驾驶行为规划所述自车的行驶轨迹,并在控制所述自车基于所述行驶轨迹执行所述第一个驾驶行为之后,重新生成所述最优驾驶行为序列,直到完成所述全局规划路径。
[0006]可选地,所述根据所述全局规划路径、所述自车的当前运动状态和区域内所有周围车辆的当前运动状态生成所述自车的最优驾驶行为序列,包括:以所述自车的当前运动状态和区域内所有周围车辆的当前运动状态为根节点,依次选择最优的子节点,直至叶子结点;在所述叶子结点处,计算所述自车在所有驾驶行为下的新子节点状态,并基于所述自车的运动模型和所述区域内所有周围车辆的运动模型对每个新子节点状态进行可达性计算,得到可达节点;在所有可达子节点中,随机选择一个子节点作为拓展节点,并从所述拓展节点出发,基于Rollout策略抵达目标状态,得到模拟结果;基于所述模拟结果进行反向传播,更新子节点路径上所有节点的评价值,直到满足迭代停止条件,并根据所述所有节点的评价值确定最优路径,基于所述最优路径上的节点对应的驾驶行为生成所述最优驾驶行为序列。
[0007]可选地,每个节点中均保存有所述自车和区域内所有周围车辆的运动状态,并基于所述自车的运动模型和所述区域内所有周围车辆的运动模型更新每个节点中所述自车和区域内所有周围车辆的运动状态。
[0008]可选地,基于所述自车的运动模型和所述区域内所有周围车辆的运动模型对每个新子节点状态进行可达节点计算,得到可达节点,包括:根据所述自车的当前运动状态和区域内所有周围车辆的当前运动状态预测所述区域内所有周围车辆的横向与纵向行为,得到横向与纵向行为预测结果;基于横向与纵向行为预测结果匹配所述区域内所有周围车辆的运动模型,基于所述自车的运动模型和所述区域内所有周围车辆的运动模型验证每个新子节点状态是否满足所述自车的行为约束条件;在满足所述自车的行为约束条件时,确定节点可达。
[0009]可选地,根据所述自车的当前运动状态和区域内所有周围车辆的当前运动状态预测所述区域内所有周围车辆的横向与纵向行为,得到横向与纵向行为预测结果,包括:将当前运动状态和区域内所有周围车辆的当前运动状态预测输入至预先训练完成的换道行为预测动态贝叶斯网络,输出所述区域内所有周围车辆的换道行为置信度,其中,所述换道行为预测动态贝叶斯网络中的变量信息包括换道区、换道意图、换道驱动、车道线横向距离、横向速度、与前车速度差和纵向距离差;将当前运动状态和区域内所有周围车辆的当前运动状态预测输入至预先训练完成的让行行为预测动态贝叶斯网络,输出所述让行置信度,其中,所述让行行为预测动态贝叶斯网络中的变量信息包括速度条件、距离条件、让行意图、自车纵向位置、自车纵向速度、后车纵向位置、后车纵向速度和让行与抢行完成标志。
[0010]可选地,在所述自车的运动模型和所述周围车辆的运动模型中,每个驾驶行为对应的纵向加速度和完成一个序列的时间均为预设值;所述周围车辆的运动模型还包括:对于纵向跟随行为,设置观测区域的车道头车采取匀速行驶,车道中后车采取IDM模型(Intelligence Driver Model,智能驱动模型);对于纵向让行行为,在车辆前方生成虚拟前车,并基于IDM模型控制所述车辆的纵向车速,在周围车辆之间存在冲突时,靠后车辆让行,并在周围车辆与所述自车冲突时,在让车置信度大于第一预设置信度时,确定所述周围车辆让行;对于横向变道行为,在变道车辆变换至最外侧车道、且每次变换一个车道时,设置观测区域的车道头车采取匀速行驶,车道中后车采取IDM模型,在变道车辆与原车道车辆存在冲突时,靠后车辆让行,并在换道置信度大于第二预设置信度时,确定所述变道车辆存在变道行为。
[0011]可选地,所述行为约束条件包括碰撞检验、让行校验、可行驶区域校验、最高车速校验和终点位置校验,其中,所述碰撞检验包括:在所述自车的驾驶行为结束后,判断所述自车与车道前车与后车的车距和时距是否均大于约束值,如果大于,则判定所述驾驶行为可行,否则,则判定所述驾驶行为不可行,其中,将对于非车辆的障碍物虚拟为与所述障碍物速度相同的周围车辆;所述让行校验包括:在所述自车执行换道行为时,如果与所述自车冲突车辆的让行置信度小于预设置信度时,判定所述换道行为不可行,否则,判定所述换道行为可行;所述可行驶区域校验包括:在所述自车的驾驶行为结束后,如果所述自车的位置未处于可行驶区域内,则判定所述驾驶行为不可行,否则,则判定所述驾驶行为可行;所述最高车速校验包括:在所述自车的加速行为开始时,如果所述自车的车速大于或等于当前位置的速度限值,则判定加速不可行,否则,在加速行为结束后,如果所述自车的车速大于或等于当前位置的速度限值,确定所述自车的最高车速为所述速度限值;所述终点位置校验包括:在所述自车的驾驶行为结束后,如果所述自车的纵向位置超过目标位置,且未处于目标车道内,则判定所述驾驶行为不可行。
[0012]可选地,所述驾驶行为包括加速直行、匀速直行、减速直行、左换道、右换道中的任意一种。
[0013]本申请第二方面实施例提供一种适用于高速与环路交通场景的长时域驾驶行为决策装置,包括:信息获取模块,用于获取自车的全局规划路径、所述自车的当前运动状态和区域内所有周围车辆的当前运动状态;决策模块,用于根据所述全局规划路径、所述自车的当前运动状态和区域内所有周围车辆的当前运动状态生成所述自车的最优驾驶行为序列;控制模块,用于基于所述最优驾驶行为序列的第一个驾驶行为规划所述自车的行驶轨迹,并在控制所述自车基于所述行驶轨迹执行所述第一个驾驶行为之后,重新生成所述最优驾驶行为序列,直到完成所述全局规划路径。
[0014]可选地,所述决策模块用于:以所述自车的当前运动状态和区域内所有周围车辆的当前运动本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种适用于高速与环路交通场景的长时域驾驶行为决策方法,其特征在于,包括以下步骤:获取自车的全局规划路径、所述自车的当前运动状态和区域内所有周围车辆的当前运动状态;根据所述全局规划路径、所述自车的当前运动状态和区域内所有周围车辆的当前运动状态生成所述自车的最优驾驶行为序列;以及基于所述最优驾驶行为序列的第一个驾驶行为规划所述自车的行驶轨迹,并在控制所述自车基于所述行驶轨迹执行所述第一个驾驶行为之后,重新生成所述最优驾驶行为序列,直到完成所述全局规划路径。2.根据权利要求1所述的方法,其特征在于,所述根据所述全局规划路径、所述自车的当前运动状态和区域内所有周围车辆的当前运动状态生成所述自车的最优驾驶行为序列,包括:以所述自车的当前运动状态和区域内所有周围车辆的当前运动状态为根节点,依次选择最优的子节点,直至叶子结点;在所述叶子结点处,计算所述自车在所有驾驶行为下的新子节点状态,并基于所述自车的运动模型和所述区域内所有周围车辆的运动模型对每个新子节点状态进行可达性计算,得到可达节点;在所有可达子节点中,随机选择一个子节点作为拓展节点,并从所述拓展节点出发,基于Rollout策略抵达目标状态,得到模拟结果;基于所述模拟结果进行反向传播,更新子节点路径上所有节点的评价值,直到满足迭代停止条件,并根据所述所有节点的评价值确定最优路径,基于所述最优路径上的节点对应的驾驶行为生成所述最优驾驶行为序列。3.根据权利要求2所述的方法,其特征在于,其中,每个节点中均保存有所述自车和区域内所有周围车辆的运动状态,并基于所述自车的运动模型和所述区域内所有周围车辆的运动模型更新每个节点中所述自车和区域内所有周围车辆的运动状态。4.根据权利要求2所述的方法,其特征在于,基于所述自车的运动模型和所述区域内所有周围车辆的运动模型对每个新子节点状态进行可达节点计算,得到可达节点,包括:根据所述自车的当前运动状态和区域内所有周围车辆的当前运动状态预测所述区域内所有周围车辆的横向与纵向行为,得到横向与纵向行为预测结果;基于横向与纵向行为预测结果匹配所述区域内所有周围车辆的运动模型,基于所述自车的运动模型和所述区域内所有周围车辆的运动模型验证每个新子节点状态是否满足所述自车的行为约束条件;在满足所述自车的行为约束条件时,确定节点可达。5.根据权利要求4所述的方法,其特征在于,根据所述自车的当前运动状态和区域内所有周围车辆的当前运动状态预测所述区域内所有周围车辆的横向与纵向行为,得到横向与纵向行为预测结果,包括:将当前运动状态和区域内所有周围车辆的当前运动状态预测输入至预先训练完成的换道行为预测动态贝叶斯网络,输出所述区域内所有周围车辆的换道行为置信度,其中,所述换道行为预测动态贝叶斯网络中的变量信息包括换道区、换道意图、换道驱动、车道线横
向距离、横向速度、与前车速度差和纵向距离差;将当前运动状态和区域内所有周围车辆的当前运动状态预测输入至预先训练完成的让行行为预测动态贝叶斯网络,输出所述让行置信度,其中,所述让行行为预测动态贝叶斯网络中的变量信息包括速度条件、距离条件、让行意图、自车纵向位置、自车纵向速度、后车纵向位置、后车纵向速度和让行与抢行完成标志。6.根据权利要求5所述的方法,其特征在于,其中,在所述自车的运动模型和所述周围车辆的运动模...

【专利技术属性】
技术研发人员:王建强许庆崔明阳杨奕彬郑昊天
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1