一种基于强化学习的室内仓储差分机器人局部避障方法技术

技术编号:39987492 阅读:44 留言:0更新日期:2024-01-09 02:00
本发明专利技术公开了一种基于强化学习的室内仓储差分机器人局部避障方法,包括步骤:采用Mid‑to‑Mid的输入输出机制,输入提取特征后的状态state;使用Subgoal信息增强,增强网络输入特征,使机器人的决策网络理解下一时刻所要达到的位置,而非全局位置;使用Dyna‑Q强化学习算法框架提升Dueling DQN神经网络算法的收敛效率;使用基于运动学模型的动作采样,解决无效动作的冗余计算,同时根据采样得到的近似表征机器人当前状态下有效的动作空间,使Dueling DQN算法获得全局渐进最优解。本发明专利技术基于模型学习的dyna‑q算法框架,学习dwa算法的避障策略,进行模型预训练,并通过对网络输入的特征提取,增加subgoal信息,并基于模型采样动作等手段,加速局部避障算法收敛速度并有效提高算法的上限。

【技术实现步骤摘要】

本专利技术涉及局部避障,尤其涉及一种基于强化学习的室内仓储差分机器人局部避障方法


技术介绍

1、在室内仓储环境中,局部避障是差分机器人智能控制中的重要任务之一。差分式机器人的局部避障可以定义为:机器人根据实时感知信息以及全局路径信息,规划一个合理的路径来避开未知的障碍物,并且这个路径不会偏离全局的路径规划。

2、目前局部避障算法有dwa滑动窗口法、人工势场法、teb算法等,这些算法在已知环境中,当遇到未知静态障碍物时,表现得效果能够令人满意;但当遇到动态障碍物时,它们的表现效果远不如静态场景下的效果,如当仓库中有较多的机器人和工作人员时,机器人容易发生震荡和紧急停止现象,机器人的工作效率低下,且搬运的货物可能会掉下来,造成财产损失并具有一定的危险性。


技术实现思路

1、为克服现有技术的不足,本专利技术提出一种基于强化学习的室内仓储差分机器人局部避障方法。

2、本专利技术的技术方案是这样实现的:

3、一种基于强化学习的室内仓储差分机器人局部避障方法,包括步骤:

本文档来自技高网...

【技术保护点】

1.一种基于强化学习的室内仓储差分机器人局部避障方法,其特征在于,包括步骤:

2.如权利要求1所述的基于强化学习的室内仓储差分机器人局部避障方法,其特征在于,所述S1包括步骤:若激光雷达的点云数据存在异常点,采用均值滤波的方式来清理激光雷达的数据。

3.如权利要求1所述的基于强化学习的室内仓储差分机器人局部避障方法,其特征在于,所述S2包括步骤:A*在已知地图下根据机器人的实时位置和目标点所规划的全局路径的一个特殊的点,所述特殊点根据机器人追踪全局路径取一个固定阈值的位置。

4.如权利要求1所述的基于强化学习的室内仓储差分机器人局部避障方法,其特征在于...

【技术特征摘要】

1.一种基于强化学习的室内仓储差分机器人局部避障方法,其特征在于,包括步骤:

2.如权利要求1所述的基于强化学习的室内仓储差分机器人局部避障方法,其特征在于,所述s1包括步骤:若激光雷达的点云数据存在异常点,采用均值滤波的方式来清理激光雷达的数据。

3.如权利要求1所述的基于强化学习的室内仓储差分机器人局部避障方法,其特征在于,所述s2包括步骤:a*在已知地图下根据机器人的实时位置和目标点所规划的全局路径的一个特殊的点...

【专利技术属性】
技术研发人员:张懿袁越吴新玲杨文欢
申请(专利权)人:广东外语外贸大学南国商学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1