一种自动驾驶汽车换道决策方法及装置制造方法及图纸

技术编号:19634376 阅读:30 留言:0更新日期:2018-12-01 15:13
本发明专利技术提供一种自动驾驶汽车换道决策方法及装置,包括:定义自动驾驶汽车换道决策候选策略集;利用评价函数确定所述自动驾驶汽车换道决策候选策略集中每条策略的奖励值,并选取奖励值最大的策略作为换道决策。本发明专利技术提供的技术方案主要提高了自动驾驶汽车的决策能力,尤其对于复杂的汽车驾驶场景,具有很好的决策效果。

Method and device for changing lane of automatic driving vehicle

The invention provides a decision-making method and a device for lane changing of an automatic driving vehicle, which comprises defining a set of candidate strategy sets for lane changing decision-making of an automatic driving vehicle, and using the evaluation function to determine the reward value of each strategy in the lane changing decision-making strategy of the automatic driving vehicle, and selecting the strategy with the greatest reward value as the lane changing decision-making. The technical proposal provided by the invention mainly improves the decision-making ability of the automatic driving vehicle, and has a good decision-making effect especially for complex vehicle driving scenes.

【技术实现步骤摘要】
一种自动驾驶汽车换道决策方法及装置
本专利技术涉及自动驾驶车辆行为决策领域,具体涉及一种自动驾驶汽车换道决策方法及装置。
技术介绍
交通环境下,自动驾驶汽车需要与其他车辆协作行驶,理解其他车辆的驾驶意图并表现出合理的驾驶行为。自动驾驶汽车换道决策能力很大程度上决定了自动驾驶汽车的行驶性能。最常用的行为决策方法是基于规则的方法,该方法具有应用简单的优点,多种基于状态机的系统用于对交通场景进行评价并且在该体系框架中进行行为决策。典型的基于状态机的系统执行一系列人工定义的决策状态以实现准确的行为决策,同时定义状态转移条件实现不同状态之间的切换。但是基于规则的行为决策体系当中,没有充分考虑环境的不确定性,在复杂的环境中,许多因素往往不能提前精确建模,这会影响基于规则方法的效率。另外一类是基于统计的决策方法。基于统计的决策方法在许多驾驶任务中是一种考虑不确定性的决策方法。基于统计的决策方法能够降低交通场景中其他交通要素行为不确定性所带来的影响,但与基于规则的方法相比较,统计方法更为复杂,决策架构的设计、交通参与者的行为分析、决策模型求解等问题均面临挑战。为给自动驾驶车辆提供准确的行驶策略,需提供一种考虑其他车辆驾驶意图,且能处理复杂场景的决策模型。
技术实现思路
为了解决复杂环境下自动驾驶汽车的换道决策问题,相较于先前基于规则与基于统计的决策方法研究,本专利技术提出一种自动驾驶汽车换道决策方法及装置。通过本方法,提高了自动驾驶汽车的决策能力,尤其对于复杂的汽车驾驶场景,具有很好的决策效果。本专利技术提供的一种自动驾驶汽车换道决策方法,其改进之处在于,包括:定义自动驾驶汽车换道决策候选策略集;利用评价函数确定所述自动驾驶汽车换道决策候选策略集中每条策略的奖励值,并选取奖励值最大的策略作为换道决策;其中,所述评价函数根据所述自动驾驶汽车换道决策候选策略集中策略对应的预测周期内自动驾驶汽车每个预测时刻的运动状态及交通场景中其他汽车每个预测时刻的运动状态构建。优选的,所述定义自动驾驶汽车换道决策候选策略集,包括:所述自动驾驶汽车换道决策候选策略集πi,用下式表示:其中,自动驾驶汽车换道决策候选策略用下式表示:上式中,LK为在Δt1+Δt2+Δt3进行LK行为;LK-LC为Δt1+Δt2进行LK行为,Δt3进行LC行为;LK-LC-LK为Δt1进行LK行为,Δt2进行LC行为,Δt3进行LK行为;LC为Δt1+Δt2+Δt3进行LC行为;LC-LK为Δt1+Δt2进行LC行为,Δt3进行LK行为;LC-LK-LC为Δt1进行LC行为,Δt2进行LK行为,Δt3进行LC行为;其中,Δt1,Δt2,Δt3为时间参数,且thorizon=Δt1+Δt2+Δt3,thorizon为自动驾驶汽车换道候选策略的预测周期,LK行为和LC行为为汽车的横向动作,LK行为为汽车的车道保持行为,LC行为为汽车的换道行为。优选的,所述自动驾驶汽车换道决策候选策略集中策略对应的预测周期内自动驾驶汽车每个预测时刻的运动状态及交通场景中其他汽车每个预测时刻的运动状态的确定过程如下:定义汽车的起始位姿为(xA,yA,δA,θA),其中(xA,yA)为汽车坐标轴的起始位置,δA为汽车的起始前轮偏角,θA为汽车的起始航向角,(xB,yB,δB,θB)为汽车的目标位姿,(xB,yB)为汽车在坐标轴的目标位置,δB为汽车的目标前轮偏角,θB为汽车的目标航向角;当汽车的换道决策候选策略中横向动作为LK行为时,汽车的目标位姿(xB,yB,δB,θB),按下式计算:当汽车的换道决策候选策略中换道动作为LC行为时,汽车的目标位姿(xB,yB,δB,θB),按下式计算:上式中,ν为汽车的起始速度,v0为汽车变道的平均速度,Δt为汽车从所述坐标轴起始位置到目标位置的行驶时间,ymid为当前车道中心线,ytar为目标车道中心线,θlane为车道线方向对应的航向角;根据汽车的起始位姿和目标位姿确定汽车换道决策候选策略中横向动作对应的汽车的行驶曲线轨迹,所述曲线轨迹用2个五次多项式表示:x(u)=x0+x1u+x2u2+x3u3+x4u4+x5u5y(u)=y0+y1u+y2u2+y3u3+y4u4+y5u5上式中,u为设定的无量纲参数,(x0,y0)为汽车曲线轨迹起点位置,x1,x2,x3,x4,x5,y1,y2,y3,y4,y5为汽车曲线轨迹五次多项式的系数;其中,x1,x2,x3,x4,x5,y1,y2,y3,y4,y5按下式计算:x1=η1cosθAy1=η1sinθA上式中,η1,η2,η3,η4为设定的系数;利用汽车换道决策候选策略中横向动作对应的车行驶曲线轨迹组成在预测周期内汽车的行驶曲线轨迹,根据所述在预测周期内汽车的行驶曲线轨迹和对应的加速度曲线确定汽车在任一预测时刻的运动状态[x',y',θ',v'],其中,x'为汽车位置的横坐标,y'为汽车位置的纵坐标,θ'为汽车的航向角,v'为汽车的速度;利用自动驾驶汽车及交通场景中其他汽车在任一预测时刻的运动状态确定自动驾驶汽车的安全性函数及时效性函数;根据所述自动驾驶汽车的安全性函数及时效性函数按下式确定所述评价函数为:R(t)=μ1Rsafety(t)+μ2Rtime(t)+μ3Rcomfort(t)上式中,R(t)为自动驾驶汽车在预测周期内某一预测时刻t的奖励值,Rsafety为安全性函数,μ1为安全性函数的权重,Rtime为时效性函数,μ2为时效性函数的权重,Rcomfort为舒适性函数,μ3为舒适性函数的权重;所述自动驾驶汽车换道决策候选策略集中每条策略的奖励值,按下式计算:上式中,γ为折扣因子,N为自动驾驶汽车横向动作的数量。进一步的,所述利用自动驾驶汽车及交通场景中其他汽车在任一预测时刻的运动状态确定自动驾驶汽车的安全性函数及时效性函数,包括:所述安全性函数Rsafety,按下式计算:其中上式中,tTTC,i为自动驾驶汽车与交通场景中其他汽车i的距离碰撞时间,ΔdIV,i为自动驾驶汽车IV和交通场景中其他汽车i之间在某一预测时刻的车道线方向相对距离,ΔvIV,i为自动驾驶汽车IV和交通场景中其他汽车i之间在某一预测时刻车道线方向的相对速度;车辆i为某一预测时刻,自动驾驶汽车IV的前车、侧前车、侧后车三车中与自动驾驶汽车在同一车道上的车辆;所述时效性函数Rtime,按下式计算:Rtime=dgoal/vlane上式中,dgoal为自动驾驶汽车起始位置距目标位置的距离,vlane为自动驾驶汽车目标位置的可达速度;进一步的,所述舒适性函数Rcomfort,按下式计算:Rcomfort=1-|a|/amax上式中,a为自动驾驶汽车到达目标位置的加速度,amax为允许的最大加速度值。进一步的,利用部分可观测马尔科夫过程确定所述交通场景中其他汽车的换道决策候选策略中每条策略对应的横向动作。一种自动驾驶汽车换道决策装置,其改进之处在于,包括:定义模块,用于定义自动驾驶汽车换道决策候选策略集;决策模块,用于利用评价函数确定所述自动驾驶汽车换道决策候选策略集中每条策略的奖励值,并选取奖励值最大的策略作为换道决策;其中,所述评价函数根据所述自动驾驶汽车换道决策候选策略集中策略对应的预测周期内自动驾驶汽车每个预测时刻的运动状态及本文档来自技高网...

【技术保护点】
1.一种自动驾驶汽车换道决策方法,其特征在于,所述方法包括:定义自动驾驶汽车换道决策候选策略集;利用评价函数确定所述自动驾驶汽车换道决策候选策略集中每条策略的奖励值,并选取奖励值最大的策略作为换道决策;其中,所述评价函数根据所述自动驾驶汽车换道决策候选策略集中策略对应的预测周期内自动驾驶汽车每个预测时刻的运动状态及交通场景中其他汽车每个预测时刻的运动状态构建。

【技术特征摘要】
1.一种自动驾驶汽车换道决策方法,其特征在于,所述方法包括:定义自动驾驶汽车换道决策候选策略集;利用评价函数确定所述自动驾驶汽车换道决策候选策略集中每条策略的奖励值,并选取奖励值最大的策略作为换道决策;其中,所述评价函数根据所述自动驾驶汽车换道决策候选策略集中策略对应的预测周期内自动驾驶汽车每个预测时刻的运动状态及交通场景中其他汽车每个预测时刻的运动状态构建。2.如权利要求1所述的方法,其特征在于,所述定义自动驾驶汽车换道决策候选策略集,包括:所述自动驾驶汽车换道决策候选策略集πi,用下式表示:其中,自动驾驶汽车换道决策候选策略用下式表示:上式中,LK为在Δt1+Δt2+Δt3进行LK行为;LK-LC为Δt1+Δt2进行LK行为,Δt3进行LC行为;LK-LC-LK为Δt1进行LK行为,Δt2进行LC行为,Δt3进行LK行为;LC为Δt1+Δt2+Δt3进行LC行为;LC-LK为Δt1+Δt2进行LC行为,Δt3进行LK行为;LC-LK-LC为Δt1进行LC行为,Δt2进行LK行为,Δt3进行LC行为;其中,Δt1,Δt2,Δt3为时间参数,且thorizon=Δt1+Δt2+Δt3,thorizon为自动驾驶汽车换道候选策略的预测周期,LK行为和LC行为为汽车的横向动作,LK行为为汽车的车道保持行为,LC行为为汽车的换道行为。3.如权利要求1所述的方法,其特征在于,所述自动驾驶汽车换道决策候选策略集中策略对应的预测周期内自动驾驶汽车每个预测时刻的运动状态及交通场景中其他汽车每个预测时刻的运动状态的确定过程如下:定义汽车的起始位姿为(xA,yA,δA,θA),其中(xA,yA)为汽车坐标轴的起始位置,δA为汽车的起始前轮偏角,θA为汽车的起始航向角,(xB,yB,δB,θB)为汽车的目标位姿,(xB,yB)为汽车在坐标轴的目标位置,δB为汽车的目标前轮偏角,θB为汽车的目标航向角;当汽车的换道决策候选策略中横向动作为LK行为时,汽车的目标位姿(xB,yB,δB,θB),按下式计算:当汽车的换道决策候选策略中换道动作为LC行为时,汽车的目标位姿(xB,yB,δB,θB),按下式计算:上式中,v为汽车的起始速度,v0为汽车变道的平均速度,Δt为汽车从所述坐标轴起始位置到目标位置的行驶时间,ymid为当前车道中心线,ytar为目标车道中心线,为车道线方向对应的航向角;根据汽车的起始位姿和目标位姿确定汽车换道决策候选策略中横向动作对应的汽车的行驶曲线轨迹,所述曲线轨迹用2个五次多项式表示:x(u)=x0+x1u+x2u2+x3u3+x4u4+x5u5y(u)=y0+y1u+y2u2+y3u3+y4u4+y5u5上式中,u为设定的无量纲参数,(x0,y0)为汽车曲线轨迹起点位置,x1,x2,x3,x4,x5,y1,y2,y3,y4,y5为汽车曲线轨迹五次多项式的系数;其中,x1,x2,x3,x4,x5,y1,y2...

【专利技术属性】
技术研发人员:宋威龙汪洋崔星李胜飞杨福威余雪玮
申请(专利权)人:中国北方车辆研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1