一种改进DDPG算法的无人车路径规划方法技术

技术编号:29132027 阅读:29 留言:0更新日期:2021-07-02 22:27
本发明专利技术公开了一种改进DDPG算法的无人车路径规划方法,具体包括以下步骤:步骤S1:设计奖励函数;步骤S2:改进OU噪声;步骤S3:设计网络结构;步骤S4:TORCS模拟器环境验证。本发明专利技术是基于深度强化学习的无人车控制方法,避免了传统无人车控制方法手动调参,耗时费力的弊端。同时通过设计奖励函数、改进OU噪声和根据传感器的反馈设计神经网络结构,在TORCS模拟器环境下验证了大大加快了算法的收敛速度,实现无人车的快速控制并提高运行稳定性,最终可得到一条最优路径。

【技术实现步骤摘要】
一种改进DDPG算法的无人车路径规划方法
本专利技术涉及深度强化学习和无人车路径规划领域,更具体地,涉及一种改进DDPG算法的无人车路径规划方法。
技术介绍
无人车技术是涉及机器人技术、车辆工程、人工智能、计算机技术等在内的交叉学科,在各个方面都有着广泛的应用。在无人车的各项技术中,无人车的路径规划是其中的一个重要组成部分。传统的无人车路径规划算法再环境的状态急剧增大时,其计算量会大大增加,无法进行有效的处理,同时其对环境的适应能力较低,无法泛化处一个通用的算法模型。
技术实现思路
本专利技术提供一种改进DDPG算法的无人车路径规划方法,解决了在复杂连续空间内的无人车路径规划问题。为了达到上述目的,本专利技术的技术方案如下:改进DDPG算法的无人车路径规划方法,其特征在于:具体包括以下步骤:步骤S1:设计奖励函数,所述奖励函数一方面考虑车辆须保持一定的速度在道路中轴行驶,另一方面考虑车辆安全,若车辆当前状态与上一时刻状态相比如果发生损坏,对该车辆动作进行惩罚;奖励函数如下式所示;rew本文档来自技高网...

【技术保护点】
1.改进DDPG算法的无人车路径规划方法,其特征在于:/n具体包括以下步骤:/n步骤S1:设计奖励函数,所述奖励函数一方面考虑车辆须保持一定的速度在道路中轴行驶,另一方面考虑车辆安全,若车辆当前状态与上一时刻状态相比如果发生损坏,对该车辆动作进行惩罚;奖励函数如下式所示;/nreward=speed*(cos(angle)-|2sin(angle)|-trackPos) (1)/n上式中,angle表示车辆方向与道路方向的夹角,speed*cos(angle)表示车辆沿着道路方向的速度,speed*sin(angle)表示车辆沿与道路垂直方向的速度,trackPos表示车辆与轨道轴之间...

【技术特征摘要】
1.改进DDPG算法的无人车路径规划方法,其特征在于:
具体包括以下步骤:
步骤S1:设计奖励函数,所述奖励函数一方面考虑车辆须保持一定的速度在道路中轴行驶,另一方面考虑车辆安全,若车辆当前状态与上一时刻状态相比如果发生损坏,对该车辆动作进行惩罚;奖励函数如下式所示;
reward=speed*(cos(angle)-|2sin(angle)|-trackPos)(1)
上式中,angle表示车辆方向与道路方向的夹角,speed*cos(angle)表示车辆沿着道路方向的速度,speed*sin(angle)表示车辆沿与道路垂直方向的速度,trackPos表示车辆与轨道轴之间的距离,如果车辆前一时刻和后一时刻车辆发生损坏,在上式基础上再减去10;
步骤S2:改进...

【专利技术属性】
技术研发人员:宋晓茹朱坚刘锦豪李彤晖刘康
申请(专利权)人:西安工业大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1