一种基于深度强化学习的单腿机器人连续跳跃控制方法技术

技术编号：37478740 阅读：24 留言：0更新日期：2023-05-07 09:19

本发明专利技术公开了一种基于深度强化学习的单腿机器人连续跳跃控制方法，根据机器人正运动学计算实时腿长，并将实时腿长与有限状态机中预设的目标腿长进行对比，判断是否进行跳跃阶段切换；虚拟弹簧

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度强化学习的单腿机器人连续跳跃控制方法

[0001]本专利技术属于机器人控制
，具体涉及一种基于深度强化学习的单腿机器人连续跳跃控制方法。

技术介绍

[0002]对于腿足式机器人，在环境中能够克服大间隙和高平台的跳跃能力是至关重要的。跳跃的特点是瞬时力大、力变化速度快、持续时间短。据生物力学家研究表明，生物个体能够达到的最大跳跃高度取决于其下肢的三个力学特征：能产生的最大的力、最大的伸展速度以及伸展范围。因此，在机器人跳跃的过程中合理控制和规划这三个力学特征，对于充分挖掘其跳跃能力是至关重要的。此外，动物在奔跑时可以通过调节腿部骨骼肌系统的刚度，将身体的重力和动能转化为应变能，以适应落地带来的冲击并重新加速自己的身体，使其运动变得更加灵活和稳健。对于连续跳跃运动，机器人的落地缓冲过程将直接决定其再次跳跃的高度和稳定性，而动物这种“可调节刚度”的思想为更好的处理机器人落地缓冲过程提供了新的思路。
[0003]目前针对单腿机器人连续跳跃的控制方法，或是建模计算较为复杂难以在控制器上实时实现，或是控制模型为...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的单腿机器人连续跳跃控制方法，其特征在于：将机器人动力学建模为虚拟弹簧
‑
阻尼模型，根据机器人正运动学计算实时腿长，并将实时腿长与有限状态机中预设的目标腿长进行对比，判断是否进行跳跃阶段切换；所述虚拟弹簧
‑
阻尼模型根据当前跳跃阶段计算足部末端虚拟力，进而得到所需的关节力矩，控制机器人进行运动；所述虚拟弹簧
‑
阻尼模型中的刚度、阻尼由动作空间信息中的刚度系数和阻尼系数进行更新；所述目标腿长包括跳跃腿长、飞行腿长和落地缓冲腿长，且有限状态机中预设的目标腿长根据如下方式进行更新：除第一次跳跃以外，满足实时腿长小于落地缓冲腿长时，更新跳跃腿长和飞行腿长；当机器人跳跃至最高点且绝对速度为0时，更新落地缓冲腿长；所述动作空间信息为策略网络的输出，策略网络的输入为观察空间信息，且策略网络根据奖励数值以固定周期进行优化，所述奖励数值由机器人当前状态信息根据奖励函数计算。2.根据权利要求1所述的单腿机器人连续跳跃控制方法，其特征在于，所述动作空间信息为：虚拟弹簧
‑
阻尼模型Z方向的刚度系数、阻尼系数，虚拟弹簧
‑
阻尼模型X方向的刚度系数、阻尼系数，跳跃腿长、飞行腿长和落地腿长。3.根据权利要求1所述的单腿机器人连续跳跃控制方法，其特征在于，所述观察空间信息为：H
sum
是足部末端累计离地高度，z
′
是足部末端在世界坐标系下距离地面的高度，x是足部末端在机器人所定义坐标系中X方向的位置，v
base
为机器人基体的绝对速度，θ1是机器人大腿与水平方向的夹角，θ2是机器人大腿与小腿之间的夹角，为大腿关节的实时角速度，为小腿关节的实时角速度。4.根据权利要求3所述的单腿机器人连续跳跃控制方法，其特征在于，所述足部末端累计离地高度满足：z'(t)＝z
base
(t)
‑
h
base
‑
l(t)z
base
(t)＝h
p
‑
l
base<...

【专利技术属性】
技术研发人员：明爱国，孙能祥，孟非，顾赛，刘伯韬，黄强，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人