一种联合驾驶风格和博弈理论的自主车换道策略的计算方法技术

技术编号:19057895 阅读:39 留言:0更新日期:2018-09-29 12:22
一种联合驾驶风格和博弈理论的自主车换道策略的计算方法,其属于车联网无人驾驶领域。目前针对于车辆的换道策略,大多都采取基于安全间隙的策略机制,缺乏对车辆之间相互作用的分析,效率较低。同时考虑车辆之间的相互作用以及驾驶员的驾驶风格因素,使用博弈论的方法对参与者进行有效分析,将驾驶员的驾驶风格作为影响博弈收益的因素,利用纳什均衡进行求解,从而产生换道场景下自主车的最优策略。

【技术实现步骤摘要】
一种联合驾驶风格和博弈理论的自主车换道策略的计算方法
本专利技术属于车联网无人驾驶领域,涉及到一种联合驾驶风格和博弈理论的自主车换道策略,为自主车提供换道决策。
技术介绍
现阶段的交通运输系统已发展的极为庞大,但与此同时产生的环境污染问题和交通安全问题成为两大急需解决的重要难题。无人驾驶与辅助驾驶借助于车辆与车辆之间、车辆与基础设施之间的相互通信,能够很好的实现路径规划与安全防范,成为当下研究的热点,受到国内外的密切关注。按照智能化的水平,可以将智能网联汽车划分为驾驶辅助、部分自动驾驶、有条件自动驾驶、高度自动驾驶和完全自动驾驶这五个等级,越往上智能化水平越高。尽管对无人驾驶的研究已经取得了巨大的突破与进展,但现在大多研究都处于起步阶段,距离完全自动驾驶还需要一定的时间。同时,无人驾驶与有人驾驶混合的交通环境下,如何保证两者的有效协作也是一个需要考虑的问题。在2016中国汽车工程学会的年会上,李德毅院士就提出了在混合场景下,自动驾驶模式缺少交互认知能力这一主要问题,并且进行了演示与说明,进一步强调了混合环境下车辆之间相互协同的重要作用。车辆的主要行为包括跟驰和换道两种,其中换道是引发交通事故的常见操作。许多换道策略的研究依赖于交通理论的发展,主要集中在根据固定的规则确定换道动作,缺乏对车辆之间相互交互的考虑;同时追求过度安全,很难保证换道的效率。随着通信技术、数据处理技术以及传感器技术的发展,车联网环境下的V2V通信和V2I通信为有效的解决车辆感知周围环境的不确定性问题提供了方法。换道行为可以看成是多个参与者之间的相互竞争,是一种博弈行为,许多研究者利用博弈论的相关方法进行换道方面的研究。HideyukiKita[9]利用博弈论的分析方法,针对车辆并道的场景提出了一种合并-让路的交互模型。Kita利用整个场景中各个车辆之间的交互关系,以避免碰撞时间(Timetocollision,TTC)来建立博弈参与者的收益,形成收益矩阵,最后通过纳什均衡找到最优策略,但缺乏对驾驶员相关的考虑。Talebpour等人[TalebpourA,MahmassaniHS,HamdarSH.ModelingLane-ChangingBehaviorinaConnectedEnvironment:AGameTheoryApproach☆[J].TransportationResearchPartC,2015,59:216-232.]利用车联网环境下信息的交互,建立了联通环境下基于非零和博弈的换道模型。Talebpour等人认为利用车辆互联,目标换道车辆可以及时获取周围车辆的准确运行状态,从而能为有效的换道决策提供强有力的信息支持,提高换道的安全性与准确性,但缺乏对驾驶员的考虑。
技术实现思路
本专利技术的目的是在联合驾驶风格和博弈理论的基础上,为自主车提供换道决策,提高其换道效率。该方法同时考虑车辆之间的相互作用以及风格因素,使用博弈论的方法对参与者进行有效分析,同时考虑将驾驶员的驾驶风格作为影响博弈收益的因素,利用纳什均衡进行求解,从而产生换道场景下的最优策略。本专利技术的技术方案是:首先,以一种非合作的博弈方式对换道行为进行深入分析;其次,采取基于车辆运行状态的方法对有人车的驾驶员进行驾驶风格计算(为保持统一,自主车的驾驶风格为正常型);在博弈分析的基础上使用驾驶风格进行博弈收益的合理定义;最后,利用纳什均衡进行博弈模型的求解,从而为自主车提供换道决策。为自主车提供换道决策的具体步骤如下:步骤1:数据预处理,即从自主车及其周围车辆获取的运行状态数据中选取博弈收益计算需要的数据,主要包括:自主车及其周围车辆的速度、加速度、位置等。步骤2:基于车辆运行状态的驾驶风格计算:利用车辆在高速公路上的相关数据计算高速工况的平均冲击度,根据驾驶员在[t0-ω,t0]时间内的车速、时间信息,计算出这一时间段内的冲击度的标准差;根据冲击度的标准差与平均冲击度的比值计算驾驶员的驾驶风格识别系数Rdriver;将驾驶员的驾驶风格系数Rdriver与标准的驾驶风格系数阈值进行比较,确定驾驶员的驾驶风格;步骤3:建立博弈换道决策分析模型:即利用博弈论的方法分析换道场景下的博弈要素,并结合驾驶风格进行博弈参与者收益的合理定义;相关收益的计算方式如下:其中RS、RP2分别为车辆S和车辆P2的驾驶风格系数,分别表示t0时刻车辆P1和车辆S1的速度,分别表示t0时刻车辆P2和车辆S的加速度,LS、LP2分别表示车辆S和车辆P2的车长,MSS分别表示t0时刻目标车辆S与其前车S1之间的距离以及最小安全距离,分别表示换道完成时刻tT时车辆P1与车辆S的间距、车辆S与车辆S2的间距以及车辆S1与车辆S的间距,G(P1-S)、G(S-P2)、G(S1-S)分别表示换道完成时刻tT时车辆P1和车辆S的最小间距、车辆S和车辆P2的最小间距,车辆S1和车辆S的最小间距;步骤4:纳什均衡及其求解:即利用纳什均衡的方法求解博弈收益矩阵,为自主车提供换道决策。目标车辆S和车辆P2的纯策略集合分别为A={换道,不换道}、B={加速,减速}。车辆S选择换道的概率为p,则其选择不换道的概率为1-p,记为向量x=(p,1-p),其中0≤p≤1;车辆P2选择加速的概率为q,则其选择减速的概率为1-q,记为向量y=(q,1-q)T,其中0≤q≤1。依据纳什均衡的求解方法,所求的混合策略纳什均衡等价于:即由此计算出来的x和y分别记为x*和y*,则x*、y*为换道博弈的一个纳什均衡。本专利技术的效果和益处是:其一是同时考虑自主车与目标车道后车的相互作用以及有人车驾驶员驾驶风格对收益的作用,对车辆之间的相互作用分析的更加深入;其二是以博弈理论的思想刻画换道过程的非合作行为,为自主车提供更有效和安全的换道决策。附图说明附图1是换道模型的状态图。附图2是自主车换道场景图。具体实施方式以下结合技术方案和附图详细叙述本专利技术的具体实施方式。1、换道模型状态图在实际场景中,换道车辆可依据当前周围环境状况采取向左换道或者向右换道,两种换道场景的解决方案是一致的,这里以向左换道为例(图2)。图1为换道模型的状态示意图,其中的初始化操作主要是用来数据采集及处理,然后计算当前时刻下目标车道后车P2的风格系数,同时作为博弈收益的影响因素进入收益函数的计算,最后根据混合策略纳什均衡做出换道决策,作为自主车的换道决策。2、基于车辆运行状态的驾驶风格计算利用汽车在行驶过程中产生的冲击度,进行相关研究与分析,提出了驾驶员风格识别系数Rdriver这一概念,同时通过实验进行验证,表明提出的风格系数能够准确的确定驾驶员的驾驶风格。冲击度在物理上的定义为加速度的变化率,使用J(t)表示。其中v(t)代表车辆在t时刻时的速度。在时间窗大小为ω的时间段内计算冲击度,取该时间段内的冲击度的标准差RJ,以及标准驾驶员在相同行驶工况下的平均冲击度就能够计算出驾驶员在t时刻的驾驶风格系数,从而有效的识别驾驶员的行驶风格。驾驶风格系数Rdriver定义为:其中Rdriver为驾驶员的风格系数,为在相同工况下正常驾驶员的平均冲击度,RJ为被测量的驾驶员在时间窗内计算出来的冲击度的标准差。同时,通过大量实验与研究,作者建议将时间窗设定为6s或9s具有本文档来自技高网
...

【技术保护点】
1.一种联合驾驶风格和博弈理论的自主车换道策略的计算方法,利用网联环境下车与车之间的通讯技术,获取自主车自身及其周围的状态信息,使用博弈论的方法进行换道策略的选取;其特征是:首先,以一种非合作的博弈方式对换道行为进行深入分析;其次,采取基于车辆运行状态的方法对有人车的驾驶员进行驾驶风格计算;在博弈分析的基础上使用驾驶风格进行博弈收益的合理定义;最后,利用纳什均衡进行博弈模型的求解,从而为自主车提供换道决策;为自主车提供换道决策的具体步骤如下:步骤1:数据预处理:即从自主车及其周围车辆获取的运行状态数据中选取博弈收益计算需要的数据,包括:自主车及其周围车辆的速度、加速度、位置;步骤2:基于车辆运行状态的驾驶风格计算:利用车辆在高速公路上的相关数据计算高速工况的平均冲击度,根据驾驶员在[t0‑ω,t0]时间内的车速、时间信息,计算出这一时间段内的冲击度的标准差;根据冲击度的标准差与平均冲击度的比值计算驾驶员的驾驶风格识别系数Rdriver;将驾驶员的驾驶风格系数Rdriver与标准的驾驶风格系数阈值进行比较,确定驾驶员的驾驶风格;步骤3:建立博弈换道决策分析模型:即利用博弈论的方法分析换道场景下的博弈要素,并结合驾驶风格进行博弈参与者收益的合理定义;相关收益的计算方式如下:...

【技术特征摘要】
1.一种联合驾驶风格和博弈理论的自主车换道策略的计算方法,利用网联环境下车与车之间的通讯技术,获取自主车自身及其周围的状态信息,使用博弈论的方法进行换道策略的选取;其特征是:首先,以一种非合作的博弈方式对换道行为进行深入分析;其次,采取基于车辆运行状态的方法对有人车的驾驶员进行驾驶风格计算;在博弈分析的基础上使用驾驶风格进行博弈收益的合理定义;最后,利用纳什均衡进行博弈模型的求解,从而为自主车提供换道决策;为自主车提供换道决策的具体步骤如下:步骤1:数据预处理:即从自主车及其周围车辆获取的运行状态数据中选取博弈收益计算需要的数据,包括:自主车及其周围车辆的速度、加速度、位置;步骤2:基于车辆运行状态的驾驶风格计算:利用车辆在高速公路上的相关数据计算高速工况的平均冲击度,根据驾驶员在[t0-ω,t0]时间内的车速、时间信息,计算出这一时间段内的冲击度的标准差;根据冲击度的标准差与平均冲击度的比值计算驾驶员的驾驶风格识别系数Rdriver;将驾驶员的驾驶风格系数Rdriver与标准的驾驶风格系数阈值进行比较,确定驾驶员的驾驶风格;步骤3:建立博弈换道决策分析模型:即利用博弈论的方法分析换道场景下的博弈要素,并结合驾驶风格进行博弈参与者收益的合理定义;相关收益的计算方式如下:其中RS为车辆S的驾驶风格系数,RP2为...

【专利技术属性】
技术研发人员:谭国真梁文斌丁男刘明剑
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1