自主车辆策略的生成制造技术

技术编号：20923915 阅读：22 留言：0更新日期：2019-04-20 11:18

本申请涉及自主车辆策略的生成。一种自主车辆策略生成系统可以包括：状态输入生成器，所述状态输入生成器生成与正在经历训练的自主车辆相关联的一组属性；交通模拟器，所述交通模拟器模拟出模拟环境，所述模拟环境包括所述自主车辆、与多条车道相关联的道路、以及所述模拟环境内的另一车辆；Q‑掩蔽器，所述Q‑掩蔽器确定针对某个时间间隔要应用于所述自主车辆的一组可能动作中的一个子组的掩蔽；以及动作生成器，所述动作生成器从所述一组可能动作中探索剩余的一组动作，并且基于所述剩余的一组动作和与所述自主车辆相关联的所述一组属性确定针对所述时间间隔的自主车辆策略。

Generation of Autonomous Vehicle Strategy

This application relates to the generation of autonomous vehicle strategy. An autonomous vehicle strategy generation system may include: a state input generator that generates a set of attributes associated with an autonomous vehicle undergoing training; a traffic simulator that simulates an analog environment that includes the autonomous vehicle, a road associated with multiple lanes, and another in the analog environment. A vehicle; a Q mask, the Q mask determines a masking for a subgroup of possible actions to be applied to the autonomous vehicle at a certain time interval; and an action generator that explores the remaining set of actions from the set of possible actions and is based on the remaining set of actions and the one associated with the autonomous vehicle. Group attributes determine the autonomous vehicle strategy for the time interval.

全部详细技术资料下载

【技术实现步骤摘要】
自主车辆策略的生成相关申请的交叉引用本申请要求2017年10月12日提交的名称为“TACTICALDECISIONMAKINGFORLANECHANGINGWITHDEEPREINFORCEMENTLEARNING”的美国临时专利申请序列号62/571717(代理人案卷号HRA-43303)的权益；上面提到的一个或多个申请的全部内容以引用方式并入本文。
技术介绍
近年来，自动驾驶汽车得到人们越来越多的关注。但自主驾驶车辆面临许多决策，诸如何时变换车道、如何变换车道，等等。而这些决策时常在多车道或多主体的背景或环境中作出。在任何情况下，自动驾驶车辆都可以被要求以安全的方式有效地执行对车道变换的策划。这在以多车道高速公路为背景或环境的情况下可能是有用的，诸如在存在高速交通的情况下。由于自主车辆与其他车辆之间存在交互作用，连同许多其他因素(诸如天气或道路状况)的影响，所以确定或生成这些驾驶策划或车道变换决策可能很复杂且富有挑战性。
技术实现思路
根据一个方面，自主车辆策略生成系统可以包括状态输入生成器、交通模拟器、Q-掩蔽器和动作生成器。状态输入生成器可以生成与正在经历训练的自主车辆相关联的一组属性。交通模拟器可以模拟出模拟环境，该模拟环境包括自主车辆、与多条车道相关联的道路、以及该模拟环境内的另一车辆。Q-掩蔽器可以确定针对某个时间间隔要应用于该自主车辆的一组可能动作中的一个子组的掩蔽。动作生成器可以从该组可能动作中探索剩余的一组动作，并且基于剩余的这组动作和与该自主车辆相关联的这组属性确定针对该时间间隔的自主车辆策略。剩余的这组动作排除了被掩蔽子组的动作。这组属性可以...

【技术保护点】
1.一种自主车辆策略生成系统，其包括：状态输入生成器，所述状态输入生成器生成与正在经历训练的自主车辆相关联的一组属性；交通模拟器，所述交通模拟器模拟出模拟环境，所述模拟环境包括所述自主车辆、与多条车道相关联的道路、以及所述模拟环境内的另一车辆；Q‑掩蔽器，所述Q‑掩蔽器确定针对某个时间间隔要应用于所述自主车辆的一组可能动作中的一个子组的掩蔽；以及动作生成器，所述动作生成器从所述一组可能动作中探索剩余的一组动作，并且基于所述剩余的一组动作和与所述自主车辆相关联的所述一组属性确定针对所述时间间隔的自主车辆策略，其中所述剩余的一组动作排除了所述被掩蔽子组的动作。

【技术特征摘要】
2017.10.12 US 62/571,717;2018.08.14 US 16/103,8471.一种自主车辆策略生成系统，其包括：状态输入生成器，所述状态输入生成器生成与正在经历训练的自主车辆相关联的一组属性；交通模拟器，所述交通模拟器模拟出模拟环境，所述模拟环境包括所述自主车辆、与多条车道相关联的道路、以及所述模拟环境内的另一车辆；Q-掩蔽器，所述Q-掩蔽器确定针对某个时间间隔要应用于所述自主车辆的一组可能动作中的一个子组的掩蔽；以及动作生成器，所述动作生成器从所述一组可能动作中探索剩余的一组动作，并且基于所述剩余的一组动作和与所述自主车辆相关联的所述一组属性确定针对所述时间间隔的自主车辆策略，其中所述剩余的一组动作排除了所述被掩蔽子组的动作。2.根据权利要求1所述的自主车辆策略生成系统，其中所述一组属性包括与所述自主车辆相关联的当前速度、与所述自主车辆相关联的车道定位，以及从所述自主车辆到目标的距离，其中所述目标是期望的目的地。3.根据权利要求1所述的自主车辆策略生成系统，其中针对所述自主车辆的所述一组可能动作包括在所述时间间隔期间自主驾驶策划下列各项：保持与所述自主车辆相关联的当前速度、加速、减速、执行变换到右侧车道或执行变换到左侧车道。4.根据权利要求1所述的自主车辆策略生成系统，其中所述Q-掩蔽器基于下列各项确定要应用于所述子组的动作的所述掩蔽：指示所述自主车辆与所述模拟环境之间或者所述自主车辆与所述模拟环境内的所述另一车辆之间的预定义的容许交互作用的先验知识；指示容许的驾驶策划的交通规则；或者与所述自主车辆相关联的能力，所述能力指示与所述自主车辆相关联的在物理上可能的驾驶策划。5.根据权利要求4所述的自主车辆策略生成系统，其中所述Q-掩蔽器基于所述先验知识确定所述被掩蔽子组的动作，以便包括：当所述自主车辆定位在所述道路的最右侧车道上时自主驾驶策划执行变换到右侧车道；以及当所述自主车辆定位在所述道路的最左侧车道上时自主驾驶策划执行变换到左侧车道。6.根据权利要求4所述的自主车辆策略生成系统，其中所述Q-掩蔽器基于所述先验知识确定所述被掩蔽子组的动作，以便包括：在所述自主车辆与所述另一车辆两者定位在同一车道中的情况下，当所述自主车辆定位在所述另一车辆后方的第一阈值距离处时自主驾驶策划加速；以及在所述自主车辆与所述另一车辆两者定位在同一车道中的情况下，当所述自主车辆定位在所述另一车辆前方的第二阈值距离处时自主驾驶策划减速。7.根据权利要求4所述的自主车辆策略生成系统，其中所述Q-掩蔽器基于所述先验知识确定所述被掩蔽子组的动作，以便包括：当所述自主车辆定位在所述另一车辆的右侧并且在所述另一车辆的车道变换阈值距离内时自主驾驶策划变换到左侧车道；以及当所述自主车辆定位在所述另一车辆的左侧并且在所述另一车辆的车道变换阈值距离内时自主驾驶策划变换到右侧车道。8.根据权利要求4所述的自主车辆策略生成系统，其中所述Q-掩蔽器基于所述先验知识确定所述被掩蔽子组的动作，以便包括：在所述自主车辆与所述另一车辆之间的碰撞时间(TTC)估计值低于TTC阈值时，与预期会缩短TTC估计值相关联的任何驾驶策划。9.根据权利要求4所述的自主车辆策略生成系统，其中所述Q-掩蔽器基于所述交通规则确定所述被掩蔽子组的动作，以便包括：当与所述自主车辆相关联的当前速度大于与所述道路相关联的速度限值时加速；以及当与所述自主车辆相关联的当前速度小于与所述道路相关联的最低速度限值时减速。10...

【专利技术属性】
技术研发人员：M·库卡达姆，A·纳卡埃·赛尔维达尼，A·考斯冈，藤村希久雄，
申请(专利权)人：本田技研工业株式会社，
类型：发明
国别省市：日本,JP

全部详细技术资料下载我是这个专利的主人