【技术实现步骤摘要】
【国外来华专利技术】预测运动规划系统及方法
[0001]相关申请案的交叉引用
[0002]本专利申请要求2020年7月28日提交的标题为“预测运动规划系统和方法(PREDICTIVE MOTION PLANNING SYSTEM AND METHOD)”的美国专利申请序列号16/940,807的优先权权益,该专利申请通过引用并入本文,就像完整复制一样。
[0003]本公开涉及用于自动驾驶汽车的路径规划的系统和方法,包括用于基于轨迹生成、评估和选择进行运动规划的系统和方法。
技术介绍
[0004]自动驾驶汽车可以使用不同的传感器来感知其周围环境和车辆自身的操作参数。自动驾驶汽车通常包括基于终点目标和感测数据规划未来车辆动作的规划系统,并且车辆控制系统根据规划系统的输出生成控制命令。因此,规划系统在决策、规划和导航中发挥着至关重要的作用。
[0005]规划系统可以分解为以下分层规划器(也可以称为规划单元、规划子系统、规划模块等):任务规划器、行为规划器和运动规划器。运动规划器接收来自行为规划器的规划行为以及关于感知环境的信息 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于训练自动驾驶汽车的运动规划器的系统,其特征在于,所述系统包括处理单元,所述处理单元用于执行指令以使所述系统:接收第一组状态数据,作为对所述运动规划器的轨迹评估器代理的输入,所述第一组状态数据定义了所述自动驾驶汽车的当前状态和在当前时间跳变的环境;基于所述当前状态选择选定轨迹;基于所述选定轨迹在所述当前状态下的性能,计算所述选定轨迹的奖励;接收第二组状态数据,所述第二组状态数据定义了所述自动驾驶汽车的下一个状态和在下一个时间跳变的环境;基于所述当前状态、所述选定轨迹、计算奖励和所述下一个状态更新所述轨迹评估器代理的参数,所述轨迹评估器代理的所述参数被更新以为所述选定轨迹分配反映所述选定轨迹在未来状态中的所述计算奖励和预期性能的评估值。2.根据权利要求1所述的系统,其特征在于,所述第一组状态数据和所述第二组状态数据各自独立地包括以2D图像形式编码的状态数据。3.根据权利要求1或2所述的系统,其特征在于,所述轨迹评估器代理的所述参数根据以下等式更新:V(s
t
,τ
t
)
←
r
t
+γV(s
t+1
,τ
t+1
)其中,s
t
是在所述当前时间跳变t的所述当前状态,τ
t
是所述选定轨迹,r
t
是所述计算奖励,V(s
t
,τ
t
)是所述选定轨迹在所述当前时间跳变和所述当前状态的所述评估值,t+1是所述下一个时间跳变,V(s
t+1
,τ
t+1
)是所述选定轨迹在所述下一个时间跳变和所述下一个状态的评估值,γ是折扣因子。4.根据权利要求1至3中任一项所述的系统,其特征在于,所述轨迹评估器的所述参数根据以下等式更新:V(s
t
,τ
t
)
←
r
t
+γV(s
t+1
,TS(s
t+1
))其中,s
t
是在所述当前时间跳变t的所述当前状态,τ
t
是所述选定轨迹,r
t
是所述计算奖励,V(s
t
,τ
t
)是所述选定轨迹在所述当前时间跳变和所述当前状态的所述评估值,t+1是所述下一个时间跳变,TS(s
t+1
)是在所述下一个时间跳变的下一个选定轨迹,V(s
t+1
,TS(s
t+1
))是所述下一个选定轨迹和所述下一个状态的评估值,γ是折扣因子。5.根据权利要求1至4中任一项所述的系统,其特征在于,所述评估值生成为定义概率评估值的概率分布的一组统计度量。6.根据权利要求5所述的系统,其特征在于,根据基于一个或多个统计度量的选择标准选择所述选定轨迹。7.根据权利要求1至6中任一项所述的系统,其特征在于,定义候选轨迹的一组数据是根据轨迹生成函数定义所述候选轨迹的一组参数。8.根据权利要求7所述的系统,其特征在于,所述处理单元用于执行指令以进一步使所述系统:根据所述轨迹生成函数,从所述一组参数生成所述选定轨迹。9.根据权利要求1至8中任一项所述的系统,其特征在于,所述选定轨迹由一组2D图像定义,所述一组2D图像定义所述候选轨迹在多个时间跳变上的航点。10.一种用于训练自动驾驶汽车的运动规划器的方法,其特征在于,所述方法包括:
接收第一组状态数据,作为对所述运动规划器的轨迹评估器的输入,所述第一组状态数...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。