【技术实现步骤摘要】
本专利技术属于机器人控制,尤其涉及一种机器人运动控制方法及系统。
技术介绍
1、机器人动态目标抓取技术在工业生产线上应用广泛,是机器人领域的研究热点。在复杂的工业环境中,强化学习克服了传统机器人控制方法对环境状态变化适应能力差的缺点,成为机器人智能化研究的重要方向。目前,基于强化学习的机器人运动控制面临机器人的动作维度高、环境状态复杂,强化学习面对海量的状态数量和动作数量较难进行价值评估的问题以及奖励稀疏的问题,即当机器人到达指定位置时才能得到奖励,导致训练时间长,效果差。
技术实现思路
1、本专利技术提供一种机器人运动控制方法及系统,用于解决当机器人到达指定位置时才能得到奖励,导致训练时间长,效果差的技术问题。
2、第一方面,本专利技术提供一种机器人运动控制方法,包括:
3、获取机器人运动前的环境信息,并根据所述环境信息,采用轨迹规划算法规划出所述机器人的最优轨迹,其中,所述环境信息包括机器人的初始状态、障碍物信息和动态目标信息;
4、根据所述最优轨迹
...【技术保护点】
1.一种机器人运动控制方法,其特征在于,包括:
2.根据权利要求1所述的一种机器人运动控制方法,其特征在于,其中,所述初始状态包括机器人各个关节的角度、角速度、机器人的位置和机器人的速度;所述障碍物信息包括障碍的位置和几何尺寸;所述动态目标信息包括动态目标的几何尺寸、动态目标的位置和动态目标的运动范围。
3.根据权利要求1所述的一种机器人运动控制方法,其特征在于,所述根据所述环境信息,采用轨迹规划算法规划出所述机器人的最优轨迹包括:
4.根据权利要求1所述的一种机器人运动控制方法,其特征在于,所述轨迹模仿奖励函数的表达式为:
...【技术特征摘要】
1.一种机器人运动控制方法,其特征在于,包括:
2.根据权利要求1所述的一种机器人运动控制方法,其特征在于,其中,所述初始状态包括机器人各个关节的角度、角速度、机器人的位置和机器人的速度;所述障碍物信息包括障碍的位置和几何尺寸;所述动态目标信息包括动态目标的几何尺寸、动态目标的位置和动态目标的运动范围。
3.根据权利要求1所述的一种机器人运动控制方法,其特征在于,所述根据所述环境信息,采用轨迹规划算法规划出所述机器人的最优轨迹包括:
4.根据权利要求1所述的一种机器人运动控制方法,其特征在于,所述轨迹模仿奖励函数的表达式为:
5.根据权利要求1所述的一种机器人运动控制...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。