一种基于协同演化的自动驾驶车辆决策涌现方法技术

技术编号:24453818 阅读:63 留言:0更新日期:2020-06-10 14:58
本发明专利技术提供一种基于协同演化的自动驾驶车辆决策涌现方法。该方法包括:构建道路模型,并确定车辆在道路模型中的初始位置分布和行驶目的地;设置多个候选驾驶策略用于限定车辆的行驶速度以及前车与后车的交互关系,并根据所述多个候选驾驶策略将车辆划分到不同的种群;根据车辆运动学模型、预设的交通信号灯调度策略以及车辆对应的候选驾驶策略运行车辆;以控制车辆的多个行驶指标为优化目标,探索所述多个候选驾驶策略的优劣。本发明专利技术针对多个全局目标的优化,使得最优驾驶策略自发涌现。

A decision emergence method for autonomous vehicles based on co evolution

【技术实现步骤摘要】
一种基于协同演化的自动驾驶车辆决策涌现方法
本专利技术涉及自动驾驶
,尤其涉及一种基于协同演化的自动驾驶车辆决策涌现方法。
技术介绍
目前,城市交通规模大,动态多,变化大的特点导致交通运输系统和交通规则几乎无法应对瞬息万变的交通状况,并且无法及时对单个车辆进行合理的规划和调度。在现有技术中,中心化调度方法通常适用于小规模的情况。例如,中心化调度模型可以解决交通灯调度的最优性,提高交通吞吐量,并减少交叉路口的等待时间。然而,中心化优化算法(包括强化学习,神经网络和模糊逻辑等)的计算复杂度将随着路口数量,车辆数量和道路长度的增加而呈指数增长。而且,城市车辆网络的动态和瞬时变化的特点使得难以通过中心化优化调度算法及时响应各个车辆和各种交通状况。目前的进化算法(例如遗传算法等)和一些智能优化算法(例如蚁群算法,粒子群算法,模拟退火算法等)对于具有固有特征分布的大规模问题比较有效。然而,这些传统的进化算法未能将个体之间以及环境之间竞争与合作的影响结合在一起,随着个体车辆与环境之间V2X技术的发展,这种影响变得更加明显和突出。
技术实现思路
本专利技术的目的在于克服上述现有技术的缺陷,提供一种基于协同演化的自动驾驶车辆决策涌现方法,通过模拟竞争与合作的协同进化过程,以观察在不同环境下最优驾驶策略的涌现。根据本专利技术的第一方面,提供了一种基于协同演化的自动驾驶车辆决策涌现方法。该方法包括以下步骤:构建道路模型,并确定车辆在道路模型中的初始位置分布和行驶目的地;设置多个候选驾驶策略用于限定车辆的行驶速度以及前车与后车的交互关系,并根据所述多个候选驾驶策略将车辆划分到不同的种群;根据车辆运动学模型、预设的交通信号灯调度策略以及车辆对应的候选驾驶策略运行车辆;以控制车辆的多个行驶指标为优化目标,探索所述多个候选驾驶策略的优劣。在一个实施例中,所述构建道路模型,并设置车辆在道路模型中的初始位置分布和行驶目的地包括:构建带交叉口的双向四车道道路模型,其中道路由栅格组成,每个栅格都是一个矩形,栅格长度被设置为等于车辆长度;将随机设置车辆的初始分布并随机设置车辆目的地,当车辆中心点落入道路模型的网格中时,认为网格被占据。在一个实施例中,所述多个候选驾驶策略包括:保守策略:用于限定车辆以最大速度行驶,当前车的速度较慢时减速,不要超车;理性策略:用于限定以最大的速度行驶,当前车的速度较慢并且变道相关20米区域内没有车辆汇入时超车;贪婪策略:用于限定以最高速度行驶,始终超车。在一个实施例中,所述交通信号灯调度策略是固定时间片轮转,每个时间片为8秒。在一个实施例中,所述多个行驶指标包括平均通行时间、事故率,平均排放、平均能耗中的至少两项。根据本专利技术的第二方面,提供一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现本专利技术上述方法的步骤。根据本专利技术的第三方面,提供一种计算机设备,包括存储器和处理器,在所述存储器上存储有能够在处理器上运行的计算机程序,所述处理器执行所述程序时实现本专利技术上述的方法的步骤。与现有技术相比,本专利技术的优点在于:针对大规模全局车辆优化问题,提出引入协同演化方法,通过协作和竞争来实现多个用于全局优化的对象,例如平均速度和事故率等,通过实现多个全局目标的优化,使得最优驾驶策略自发涌现。附图说明以下附图仅对本专利技术作示意性的说明和解释,并不用于限定本专利技术的范围,其中:图1是根据本专利技术一个实施例的基于协同演化的自动驾驶车辆决策涌现方法的流程图;图2是根据本专利技术一个实施例的道路模型示意图;图3是根据本专利技术一个实施例的正态分布邻域示意图;图4是根据本专利技术一个实施例的基于协同演化的自动驾驶车辆决策涌现方法的实现流程图;图5是根据本专利技术一个实施例的道路环境示意图;图6是根据本专利技术一个实施例的种群随繁衍代数的变化趋势示意图;图7是根据本专利技术一个实施例的种群事故数量示意图;图8是根据本专利技术一个实施例的平均速度示意图;附图中,Lane-车道;Centerpoint-中心点;Vehicle-车辆;Conservativepolicy-保守策略;Radicalpolicy-贪婪策略;Rationalpolicy-理性策略;Generation代;Ratioofthesubgrouppopulation-子代种群比例;NumberofAccidents-事故数;Averagespeed-平均速度。具体实施方式为了使本专利技术的目的、技术方案、设计方法及优点更加清楚明了,以下结合附图通过具体实施例对本专利技术进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本专利技术,并不用于限定本专利技术。在本文示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。本专利技术提出了一种用于大规模自动驾驶车辆集群的多目标协同进化方法,以研究从长远来看哪种驾驶策略将实现总体良好的性能。在本专利技术中,首先,将大规模城市自动驾驶汽车的驾驶策略制定为一个多目标优化问题。然后,建立网格道路模型和车辆动力学模型,其中各个车辆之间相互间接交互,从而将交互复杂度从O(n!)(n是要交互的车辆数)降低到O(n)。本专利技术模拟了竞争与合作的协同进化过程,以观察在不同环境下最优驾驶策略的涌现。经研究,目前的中心化优化算法的计算复杂度过高,无法处理大规模的交通优化问题。另一方面,传统的进化算法和群体智能算法仅包含一个单一的种群,这对于竞争和合作的多样化环境是不够的。针对这些问题,本专利技术提出一种将协同进化与群体智能相结合的方法,以构造多个合作竞争群体,在车路协同网络中协同进化,并观察最优驾驶策略的涌现。参见图1所示,本专利技术实施例提供的基于协同演化的自动驾驶车辆决策涌现方法包括以下步骤:步骤S110,构建车辆模型和车辆运动学模型。参见图2所示,将车辆建模为长为l且宽度为w的矩形,记为ck,车辆的中心点表示为(xk,t,yk,t),即有:ck,t:(xk,t,yk,t)(1)其中,ck,t表示第k辆车在t时刻的几何中心,xk,t表示第k辆车在t时刻的几何中心的横坐标,yk,t表示第k辆车在t时刻的几何中心的纵坐标。在本专利技术中,引入车辆运动学模型来描述车辆的行为,特别是它如何影响实际情况并促进群体之间的竞争和协同作用。具体地,变道表示为:xt+1=xt+vt+1*cos(αt+θt)*Δt(3)yt+1=yt+vt+1*sin(αt+θt)*Δt(4)xt+2=xt+1+vt+1*cos(αt)*Δt(5)yt+2=yt+1+vt+1*本文档来自技高网...

【技术保护点】
1.一种基于协同演化的自动驾驶车辆决策涌现方法,包括以下步骤:/n构建道路模型,并确定车辆在道路模型中的初始位置分布和行驶目的地;/n设置多个候选驾驶策略用于限定车辆的行驶速度以及前车与后车的交互关系,并根据所述多个候选驾驶策略将车辆划分到不同的种群;/n根据车辆运动学模型、预设的交通信号灯调度策略以及车辆对应的候选驾驶策略运行车辆;/n以控制车辆的多个行驶指标为优化目标,探索所述多个候选驾驶策略的优劣。/n

【技术特征摘要】
1.一种基于协同演化的自动驾驶车辆决策涌现方法,包括以下步骤:
构建道路模型,并确定车辆在道路模型中的初始位置分布和行驶目的地;
设置多个候选驾驶策略用于限定车辆的行驶速度以及前车与后车的交互关系,并根据所述多个候选驾驶策略将车辆划分到不同的种群;
根据车辆运动学模型、预设的交通信号灯调度策略以及车辆对应的候选驾驶策略运行车辆;
以控制车辆的多个行驶指标为优化目标,探索所述多个候选驾驶策略的优劣。


2.根据权利要求1所述的基于协同演化的自动驾驶车辆决策涌现方法,其特征在于,所述构建道路模型,并设置车辆在道路模型中的初始位置分布和行驶目的地包括:
构建带交叉口的双向四车道道路模型,其中道路由栅格组成,每个栅格都是一个矩形,栅格长度被设置为等于车辆长度;
将随机设置车辆的初始分布并随机设置车辆目的地,当车辆中心点落入道路模型的网格中时,认为网格被占据。


3.根据权利要求1所述的基于协同演化的自动驾驶车辆决策涌现方法,其特征在于,在探索所述多个候选驾驶策略的优劣的过程中,采用以下奖励函数评估车辆k:



其中:
r(k)表示第k辆车的奖励函数;
η表示第k辆车引起的事故数量;
Tk表示第k辆车的生命周期;

表示第k辆车的速度;
δv表示所有车辆的速度的标准差;
β1,β2表示各项权重;

表示第k辆车t时刻的速率;
Δt表示时间步长。


4.根据权利要求3所述的基于协同演化的自动驾驶车辆决策涌现方法,其特征在于,在探索所述多个候选驾驶策略的优劣的过程中,后代的繁衍规则设置为:
当车辆得分落在平均值右侧或区域右侧的两个标准偏差邻域内时,繁殖两个后代;
当车辆得分落在平均值右侧的标准偏差邻域内时,繁殖两个后代;
车辆得分落在平均值的左侧时,不繁殖后代。


5.根据权利要求4所述的基于协同演化的自动驾驶车辆决策涌现方法,其特征在于,将所述优化目标表示为:



使得:
f1(x)=∑i∑jgi,j(t)*...

【专利技术属性】
技术研发人员:刘章杰李慧云
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1