一种机器人运动控制方法及系统技术方案

技术编号：45020163 阅读：22 留言：0更新日期：2025-04-18 17:03

本发明专利技术公开了一种机器人运动控制方法及系统，方法包括：获取机器人运动前的环境信息，并根据所述环境信息，采用轨迹规划算法规划出所述机器人的最优轨迹；根据所述最优轨迹构建轨迹模仿奖励函数，并将所述轨迹模仿奖励函数加入至自适应动态奖励函数，得到目标自适应动态奖励函数；基于所述目标自适应动态奖励函数控制所述机器人对所述最优轨迹进行模仿；根据改进裁剪机制的PPO深度强化学习算法对所述机器人的运动轨迹进行训练和学习，最终得到所述机器人的最优控制策略。自适应动态奖励机制能够根据环境状况动态调整奖励权重，而参考轨迹奖励则提供了方向性指引，这种组合在保持轨迹精确性的同时，能灵活地应对环境的实时变化。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于机器人控制，尤其涉及一种机器人运动控制方法及系统。

技术介绍

1、机器人动态目标抓取技术在工业生产线上应用广泛，是机器人领域的研究热点。在复杂的工业环境中，强化学习克服了传统机器人控制方法对环境状态变化适应能力差的缺点，成为机器人智能化研究的重要方向。目前，基于强化学习的机器人运动控制面临机器人的动作维度高、环境状态复杂，强化学习面对海量的状态数量和动作数量较难进行价值评估的问题以及奖励稀疏的问题，即当机器人到达指定位置时才能得到奖励，导致训练时间长，效果差。

技术实现思路

1、本专利技术提供一种机器人运动控制方法及系统，用于解决当机器人到达指定位置时才能得到奖励，导致训练时间长，效果差的技术问题。

2、第一方面，本专利技术提供一种机器人运动控制方法，包括：

3、获取机器人运动前的环境信息，并根据所述环境信息，采用轨迹规划算法规划出所述机器人的最优轨迹，其中，所述环境信息包括机器人的初始状态、障碍物信息和动态目标信息；

4、根据所述最优轨迹...

【技术保护点】

1.一种机器人运动控制方法，其特征在于，包括：

2.根据权利要求1所述的一种机器人运动控制方法，其特征在于，其中，所述初始状态包括机器人各个关节的角度、角速度、机器人的位置和机器人的速度；所述障碍物信息包括障碍的位置和几何尺寸；所述动态目标信息包括动态目标的几何尺寸、动态目标的位置和动态目标的运动范围。

3.根据权利要求1所述的一种机器人运动控制方法，其特征在于，所述根据所述环境信息，采用轨迹规划算法规划出所述机器人的最优轨迹包括：

4.根据权利要求1所述的一种机器人运动控制方法，其特征在于，所述轨迹模仿奖励函数的表达式为：