当前位置: 首页 > 专利查询>哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院专利>正文

一种基于强化学习的移动机器人安全运动方法技术

技术编号：38407839 阅读：16 留言：0更新日期：2023-08-07 11:15

本发明专利技术涉及移动机器人技术领域，具体公开了一种基于强化学习的移动机器人安全运动方法，包括以下技术方案：S1、设定运动方程和非线性仿射系统；S2、开发一种基于控制屏障函数CBF的保护屏障，提出包含基于CBF保护屏障的多智能体强化学习算法，以实现移动机器人AMR基于强化学习的安全运动。本发明专利技术采用上述的一种基于强化学习的移动机器人安全运动方法，可以保障移动机器人在工作过程中的安全性。障移动机器人在工作过程中的安全性。障移动机器人在工作过程中的安全性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于强化学习的移动机器人安全运动方法

[0001]本专利技术涉及移动机器人
，尤其是涉及一种基于强化学习的移动机器人安全运动方法。

技术介绍

[0002]近年来，越来越多的移动机器人AMR被投入使用。一些AMR失控的风险正在飙升，虽然基于强化学习RL的方法在大量AMR的运动规划中取得了巨大的成功，但如果一些AMR失去控制，现有的基于RL的运动方法不能为剩余的功能性AMR提供安全保证。

技术实现思路

[0003]本专利技术的目的是提供一种基于强化学习的移动机器人安全运动方法，通过CBF的单一屏蔽算法MARL处理复杂的高级任务，并通过CBF的低级屏蔽处理每个功能AMR的安全问题，可以保证移动机器人在工作过程中的安全性。
[0004]为实现上述目的，本专利技术提供了一种基于强化学习的移动机器人安全运动方法，具体步骤如下：S1、构建移动机器人AMR的运动方程和非线性仿射系统，其具体为：本专利技术针对的问题是在仓库二维空间中某些AMR失控时，基于强化学习的安全运动规划问题，AMR在工作过程中，失控的AMR会干扰可控的AMR；设定AMR型号相同，并且运动学模型已知，每个可控的和不可控的AMR都可以观察到附近AMR的位姿，AMR指差动驱动机器人DDR，DDR可以在二维笛卡尔坐标下表示，如图1所示，以表示DDR在二维笛卡尔坐标中的位姿状态，其中和表示DDR在二维笛卡尔坐标中的位置，表示DDR在二维笛卡尔坐标中的朝向，DDR状态的演化运动方程具体为：；其中、和分别表示、和的一阶导数，和分别表示和，表示...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的移动机器人安全运动方法，其特征在于：具体步骤如下：S1、构建移动机器人AMR的运动方程和非线性仿射系统；S2、构建基于控制屏障函数CBF的保护屏障和基于CBF保护屏障的多智能体强化学习算法，以实现移动机器人AMR基于强化学习的安全运动。2.根据权利要求1所述的一种基于强化学习的移动机器人安全运动方法，其特征在于：在步骤S1中，设定运动方程的具体操作为：所述AMR在工作过程中，失控的AMR会干扰可控的AMR；设定AMR型号相同，并且运动学模型已知，每个可控的和不可控的AMR都观察到附近AMR的位姿，AMR指差动驱动机器人DDR，以表示DDR在二维笛卡尔坐标中的位姿状态，其中和表示DDR在二维笛卡尔坐标中的位置，表示DDR在二维笛卡尔坐标中的朝向，DDR状态的演化运动方程具体为：；和分别表示和，表示DDR的平移速度的大小，、和分别表示、和的一阶导数，DDR的作用是调整角速度。3.根据权利要求2所述的一种基于强化学习的移动机器人安全运动方法，其特征在于：步骤S1中，非线性仿射系统为：；表示系统的状态，其中表示一个广义状态，表示一个广义状态空间，表示维实空间；表示控制输入，即动作，其中表示一个广义动作，表示一个广义动作空间，表示维实空间，和是两个局部Lipschitz的函数；通过安全集的不变性，保证系统状态的安全性，一个连续可微函数定义的集合C满足：；；；集合C被称为安全集；其中表示集合C的边界，表示集合C的内部；对于系统和集合C，具有相对阶的是指数控制屏障函数ECBF，存在满足；表示维实空间，表示上确界，表示函数对的李导数，表示函
数对的重李导数，表...

【专利技术属性】
技术研发人员：熊昊，曾伟锋，江翰韬，陆文杰，
申请(专利权)人：哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人