基于值分布深度强化学习的移动机器人局部路径规划方法技术

技术编号:40258315 阅读:21 留言:0更新日期:2024-02-02 22:49
本发明专利技术基于值分布深度强化学习的移动机器人局部路径规划方法,涉及人工智能领域,本发明专利技术方法先通过传感器实时感知周围环境信息,再通过深度强化学习DRL实现对移动机器人的实时控制,从而解决了传统路径规划控制器存在的计算时间长,安全性差的问题,实现了路径规划过程中实时的障碍物避障和对目标位置的导航。该方法不仅使得规划的路径在长度,安全性和平滑性等综合效果上令人满意;本发明专利技术方法还具有较好的泛化性,能够在多种不同环境下实现较好的规划效果,保证机器人的每个动作都是其当前观测下的最优解。

【技术实现步骤摘要】

本专利技术属于人工智能,涉及一种基于值分布深度强化学习的移动机器人局部路径规划方法


技术介绍

1、工业4.0概念被提出后,工业智能化的需求被重新定义。其中智能工厂、智能生产与智能物流的实现无一例外都需要自动化机器人的参与。自动化机器人需要机器人自主做出决策,移动是机器人的基本功能之一。因此需要机器人独立完成导航功能。如今它被广泛应用在医学、工业、航天、救援任务以及军事等领域。尤其在近年全球大环境下,如何避免人与人之间的接触完成送隔离餐、核酸检测等任务成为了研究热点。有关机器人的路径规划方面的研究正在如火如荼的进行着。

2、移动机器人路径规划的目标是通过环境感知与主动避障功能找到一条可行的最佳路径,此路径从起始点至终点在给定的工作空间中不与任何障碍物相交,同时要优化机器人运动路径,使其尽可能达到更短、更平滑的要求。可以通过对环境信息掌握的程度来将路径规划分为全局路径规划和局部路径规划。根据环境信息判断使用何种路径规划方法至关重要。路径规划算法分为传统算法与智能算法,传统算法需要先验环境信息才能进行路径规划;而智能算法这类中的深度强化学习算法通过本文档来自技高网...

【技术保护点】

1.基于值分布深度强化学习的移动机器人局部路径规划方法,其特征在于,所述路径规划包括以下步骤:

2.根据权利要求1所述的基于值分布深度强化学习的移动机器人局部路径规划方法,其特征在于,所述步骤1的环境初始化的相关参数为:

3.根据权利要求1所述的基于值分布深度强化学习的移动机器人局部路径规划方法,其特征在于,所述步骤2神经网络结构及模型训练相关参数包括:

4.根据权利要求1所述的基于值分布深度强化学习的移动机器人局部路径规划方法,其特征在于,所述步骤3中,机器人的状态空间设计如下:

5.根据权利要求1所述的基于值分布深度强化学习的移动机器人...

【技术特征摘要】

1.基于值分布深度强化学习的移动机器人局部路径规划方法,其特征在于,所述路径规划包括以下步骤:

2.根据权利要求1所述的基于值分布深度强化学习的移动机器人局部路径规划方法,其特征在于,所述步骤1的环境初始化的相关参数为:

3.根据权利要求1所述的基于值分布深度强化学习的移动机器人局部路径规划方法,其特征在于,所述步骤2神经网络结构及模型训练相关参数包括:

4.根据权利要求1所述的基于值分布深度强化学习的移动机器人局部路径规划方法,其特征在于,所述步骤3中,机器人的状态空间设计如下:

5.根据权利要求1所述的基于值分布深度强化学习的移动机器人局部路径规划方法,其特征在于,所述步骤4中,机器...

【专利技术属性】
技术研发人员:杜胜利朱泽兴韩红桂乔俊飞
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1