【技术实现步骤摘要】
一种基于深度强化学习和A星算法的无人车路径规划方法
[0001]本专利技术属于无人驾驶汽车技术,具体涉及一种面向定位受限,没 有全局信息和大尺度越野环境下的路径规划方法。
技术介绍
[0002]自动驾驶是人工智能领域的长远目标,其所需要的智能水平超过 迄今为止所有人工智能技术所达到的水平。自动驾驶的困难在于需要 让无人车拥有对环境以及环境动态性的理解,以使其能够在每一时刻 能通过行为决策来选择最优行为,并安全、快速地驶向目的地。路径 规划是无人车的关键模块,其中大多数方法依赖于高清地图和高精度 定位系统。目前的路径规划算法主要包括全局路径规划和局部路径规 划。全局路径规划算法主要有Dijkstra算法(Dijkstra E W.A note ontwo problems in connexion with graphs[J].)和A星搜索算法(Hart P E, Nilsson N J,Raphael B.A formal basis for the heuristic determination ofminimum cost paths[J].),需要准确的环境模型和先验信息,例如卫星 图和拓扑路网。局部路径规划算法依赖感知算法的性能和传感器的精 确度,其规划结果往往不是全局最优的。由于缺乏先验信息和复杂的 路况,并且高清地图的维护成本太过昂贵和缺乏精确的定位系统,这 些方法不能直接应用于农村和越野等复杂和未知的环境。
[0003]另一方面,基于深度强化学习的方法在解决现实世界的决策任务 中越来越受欢迎,因 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习和A星搜索算法的路径规划方法,其特征在于,包括如下步骤:S1:驾驶无人车在越野环境中行驶并采集3D点云数据,记录无人车行驶过的路径;S2:从S1采集的点云数据中生成多张栅格障碍图,从无人车行驶过的路径中生成当前栅格图中的目标点;S3:利用S2中的栅格障碍图以及一张表示无人车的矩形构建仿真环境,矩形上标有箭头,用来标识无人车的方向;S4:利用A星算法从S2中的每张障碍图中生成引导路径;S5:根据S4中引导路径的长度和光滑度为不同障碍图设定不同的难度;S6:利用S4中的引导路径设计奖励函数;S7:利用近端策略优化算法和S6中的奖励函数,使用深度神经网络和数据增强、课程学习在S3中的仿真环境中训练无人车智能体;S8:利用S7中无人车走过的路径当作对应障碍图的路径规划结果。2.根据权利要求1所述的一种基于深度强化学习和A星搜索算法的路径规划方法,其特征在于,所述步骤S2包括如下步骤:S200:采用基于高斯过程回归的地面分割算法,将以车为中心的100米
×
100米区域内的三维点云数据转化成500
×
500二维的栅格障碍图,每个栅格的分辨率为0.2米;S201:将障碍图裁剪成尺寸为256
×
256,便于深度神经网络训练;S202:将当前障碍图中走过的路径的最后一个点当做目标点。3.根据权利要求2所述的一种基于深度强化学习和A星搜索算法的路径规划方法,其特征在于,所述步骤S3包括如下步骤:S300:利用Pygame工具,将S2中的障碍图用作环境,用矩形表示无人车,构建出一个简单的操控无人车在障碍图中行驶的仿真环境,仿真环境中在障碍物坐标处绘制点,可通行区域不绘制任何图像,并用星形表示目标点,仿真环境的截图被用作深度强化学习算法的训练数据;S301:每当无人车执行一个动作,游戏界面会刷新,将无人车绘制在新的坐标,无人车的线加速度为l
a
,角速度为a
v
,当前的角度O,则无人车的坐标计算方式为:x=x+l
a
×
cos(O+a
v
)y=y
‑
l
a
×
sin(O+a
v
)。4.根据权利要求3所述的一种基于深度强化学习和A星搜索算法的路径规划方法,其特征在于,所述步骤S4包括如下步骤:S400:记录S2中每个障碍图中障碍物的坐标,根据环境来设定膨胀系数并进行障碍物膨胀;S401:利用膨胀后的障碍物重新绘制障碍图,并保存障碍物坐标;S402:在新的障碍图中执行A星算法,得到...
【专利技术属性】
技术研发人员:王旭,商尔科,聂一鸣,肖良,赵大伟,戴斌,
申请(专利权)人:中国人民解放军军事科学院国防科技创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。