一种路径规划方法及装置和移动设备制造方法及图纸

技术编号：20479421 阅读：14 留言：0更新日期：2019-03-02 16:55

本申请提供一种路径规划方法及装置、移动设备和计算机可读存储介质。其中，路径规划方法包括：按照初始采样策略对当前环境进行采样，得到多个状态样本点；基于第一路径规划算法获取每个状态样本点对应的第一价值；基于第二路径规划算法获取每个状态样本点对应的第二价值；对第一价值和第二价值进行加权求和，得到每个状态样本点对应的价值；基于当前每个状态样本点对应的价值确定行驶路径规划。本实施例，实现了综合两种路径规划算法确定当前行驶路径，既可以适应复杂的驾驶环境，减少与人类司机的操控行为的差距，又可以减少需要记录的操作数据量，使得所确定的当前行驶路径更合理。

全部详细技术资料下载

【技术实现步骤摘要】
一种路径规划方法及装置和移动设备
本申请涉及路径规划技术，尤其涉及一种路径规划方法及装置、移动设备和计算机可读存储介质。
技术介绍
随着计算机技术和人工智能的发展，无人车成为机器人领域的一个重要研究方向和研究热点。无人车的路径规划与控制策略是指无人车在各种状态下选择其自身动作的策略。无人车的动作包括加速、减速、转向、鸣笛、开关灯光等。对于无人车的路径规划与控制策略，目前主要有两大类方法，一类是基于启发式规则的方法，另一类是基于专家示范的方法。基于启发式规则的方法，就是通过人为制定的规则来规范无人车的路径规划和控制，这些规则是工程师在常识和直觉上认为正确的规则。例如，一条规则可以使让无人车尽量位于车道中心位置，另一条规则可以是让无人车尽量远离障碍物。基于专家示范的方法，就是记录下大量人类司机在开车的过程中进行的路径规划与控制数据，然后让计算机从这些数据中学习、模仿人类做出的规划与控制操作，最终让计算机学会对无人车进行路径规划与控制。但是，基于启发式规则的方法，有时很难适应复杂的驾驶环境，且通过规则得到的路径规划与控制策略与人类司机的操控行为差距较大。而基于专家示范的方法需要记录大量的操作数据，需要消耗大量资金、时间等资源。
技术实现思路
有鉴于此，本申请提供一种路径规划方法及装置、移动设备和计算机可读存储介质。具体地，本申请是通过如下技术方案实现的：根据本公开实施例的第一方面，提供一种路径规划方法，所述方法包括：按照初始采样策略对当前环境进行采样，得到多个状态样本点；基于第一路径规划算法获取每个状态样本点对应的第一价值；基于第二路径规划算法获取所述每个状态样本点...

【技术保护点】
1.一种路径规划方法，其特征在于，所述方法包括：按照初始采样策略对当前环境进行采样，得到多个状态样本点；基于第一路径规划算法获取每个状态样本点对应的第一价值；基于第二路径规划算法获取所述每个状态样本点对应的第二价值；对所述第一价值和所述第二价值进行加权求和，得到所述每个状态样本点对应的价值；基于当前每个状态样本点对应的价值确定行驶路径规划。

【技术特征摘要】
1.一种路径规划方法，其特征在于，所述方法包括：按照初始采样策略对当前环境进行采样，得到多个状态样本点；基于第一路径规划算法获取每个状态样本点对应的第一价值；基于第二路径规划算法获取所述每个状态样本点对应的第二价值；对所述第一价值和所述第二价值进行加权求和，得到所述每个状态样本点对应的价值；基于当前每个状态样本点对应的价值确定行驶路径规划。2.根据权利要求1所述的方法，其特征在于，所述基于当前每个状态样本点对应的价值确定行驶路径规划，包括：若当前采样策略不满足收敛条件，则更新采样策略，按照更新后的采样策略进行采样，并继续执行所述基于第一路径规划算法获取每个状态样本点对应的第一价值和所述基于第二路径规划算法获取所述每个状态样本点对应的第二价值的操作，直至当前采样策略收敛；若当前采样策略满足收敛条件，则根据当前每个状态样本点对应的价值确定当前环境下的最大价值路径，并将所述最大价值路径作为当前行驶路径。3.根据权利要求2所述的方法，其特征在于，所述收敛条件是指所述当前采样策略对应的采样密度与状态样本点对应的估值成正比。4.根据权利要求2所述的方法，其特征在于，所述更新采样策略，包括：根据高斯混合模型更新当前每个状态样本点对应的采样密度。5.根据权利要求1或2所述的方法，其特征在于，在所述基于第一路径规划算法获取每个状态样本点对应的第一价值之前，所述方法还包括：通过逆向强化学习算法训练出与所述第一路径规划算法对应的状态价值函数。6.根据权利要求5所述的方法，其特征...

【专利技术属性】
技术研发人员：钱德恒，任冬淳，丁曙光，付圣，韩勤，
申请(专利权)人：北京三快在线科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人