当前位置: 首页 > 专利查询>中国人民解放军军事科学院国防科技创新研究院专利>正文

一种基于深度强化学习和A星算法的无人车路径规划方法技术

技术编号：37190778 阅读：14 留言：0更新日期：2023-04-20 22:52

本发明专利技术公开了基于深度强化学习和A星算法的无人车路径规划方法，属于无人驾驶汽车技术。驾驶无人车在越野环境中采集3D点云数据，记录无人车行驶路径；从采集的点云数据中生成多张栅格障碍图，从无人车行驶过的路径中生成当前栅格图中的目标点；利用栅格障碍图以及一张表示无人车的矩形构建仿真环境；利用A星算法从每张障碍图中生成引导路径；根据引导路径的长度和光滑度为不同障碍图设定不同的难度；并利用引导路径设计奖励函数；利用近端策略优化算法和奖励函数，使用深度神经网络和数据增强、课程学习在仿真环境中训练无人车智能体；利用无人车走过的路径当作对应障碍图的路径规划结果。本发明专利技术适用于不同越野场景和不同尺寸的无人车路径规划。寸的无人车路径规划。寸的无人车路径规划。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度强化学习和A星算法的无人车路径规划方法

[0001]本专利技术属于无人驾驶汽车技术，具体涉及一种面向定位受限，没有全局信息和大尺度越野环境下的路径规划方法。

技术介绍

[0002]自动驾驶是人工智能领域的长远目标，其所需要的智能水平超过迄今为止所有人工智能技术所达到的水平。自动驾驶的困难在于需要让无人车拥有对环境以及环境动态性的理解，以使其能够在每一时刻能通过行为决策来选择最优行为，并安全、快速地驶向目的地。路径规划是无人车的关键模块，其中大多数方法依赖于高清地图和高精度定位系统。目前的路径规划算法主要包括全局路径规划和局部路径规划。全局路径规划算法主要有Dijkstra算法(Dijkstra E W.A note ontwo problems in connexion with graphs[J].)和A星搜索算法(Hart P E, Nilsson N J,Raphael B.A formal basis for the heuristic determination ofminimum cost paths[J].)，需要准确的环境模型和先验信息，例如卫星图和拓扑路网。局部路径规划算法依赖感知算法的性能和传感器的精确度，其规划结果往往不是全局最优的。由于缺乏先验信息和复杂的路况，并且高清地图的维护成本太过昂贵和缺乏精确的定位系统，这些方法不能直接应用于农村和越野等复杂和未知的环境。
[0003]另一方面，基于深度强化学习的方法在解决现实世界的决策任务中越来越受欢迎，因...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习和A星搜索算法的路径规划方法，其特征在于，包括如下步骤：S1:驾驶无人车在越野环境中行驶并采集3D点云数据，记录无人车行驶过的路径；S2:从S1采集的点云数据中生成多张栅格障碍图，从无人车行驶过的路径中生成当前栅格图中的目标点；S3:利用S2中的栅格障碍图以及一张表示无人车的矩形构建仿真环境，矩形上标有箭头，用来标识无人车的方向；S4:利用A星算法从S2中的每张障碍图中生成引导路径；S5:根据S4中引导路径的长度和光滑度为不同障碍图设定不同的难度；S6:利用S4中的引导路径设计奖励函数；S7:利用近端策略优化算法和S6中的奖励函数，使用深度神经网络和数据增强、课程学习在S3中的仿真环境中训练无人车智能体；S8:利用S7中无人车走过的路径当作对应障碍图的路径规划结果。2.根据权利要求1所述的一种基于深度强化学习和A星搜索算法的路径规划方法，其特征在于，所述步骤S2包括如下步骤：S200：采用基于高斯过程回归的地面分割算法，将以车为中心的100米
×
100米区域内的三维点云数据转化成500
×
500二维的栅格障碍图，每个栅格的分辨率为0.2米；S201：将障碍图裁剪成尺寸为256
×
256，便于深度神经网络训练；S202：将当前障碍图中走过的路径的最后一个点当做目标点。3.根据权利要求2所述的一种基于深度强化学习和A星搜索算法的路径规划方法，其特征在于，所述步骤S3包括如下步骤：S300：利用Pygame工具，将S2中的障碍图用作环境，用矩形表示无人车，构建出一个简单的操控无人车在障碍图中行驶的仿真环境，仿真环境中在障碍物坐标处绘制点，可通行区域不绘制任何图像，并用星形表示目标点，仿真环境的截图被用作深度强化学习算法的训练数据；S301：每当无人车执行一个动作，游戏界面会刷新，将无人车绘制在新的坐标，无人车的线加速度为l
a
，角速度为a
v
，当前的角度O，则无人车的坐标计算方式为：x＝x+l
a
×
cos(O+a
v
)y＝y
‑
l
a
×
sin(O+a
v
)。4.根据权利要求3所述的一种基于深度强化学习和A星搜索算法的路径规划方法，其特征在于，所述步骤S4包括如下步骤：S400：记录S2中每个障碍图中障碍物的坐标，根据环境来设定膨胀系数并进行障碍物膨胀；S401：利用膨胀后的障碍物重新绘制障碍图，并保存障碍物坐标；S402：在新的障碍图中执行A星算法，得到...

【专利技术属性】
技术研发人员：王旭，商尔科，聂一鸣，肖良，赵大伟，戴斌，
申请(专利权)人：中国人民解放军军事科学院国防科技创新研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人