一种四足机器人运动控制方法、系统、存储介质及设备技术方案

技术编号:33795486 阅读:97 留言:0更新日期:2022-06-12 14:58
本发明专利技术涉及自适应控制技术领域,提供了一种四足机器人运动控制方法、系统、存储介质及设备,包括:获取四足机器人在环境中行走时的状态,通过策略网络根据状态选择动作;获取四足机器人在环境中行走时的足端位置,以计算得到参考动作;结合参考动作与策略网络输出的动作,得到四足机器人执行的动作,发出动作指令至四足机器人,实现四足机器人的运动,实现了四足机器人更稳定、鲁棒的运动规划与控制。鲁棒的运动规划与控制。鲁棒的运动规划与控制。

【技术实现步骤摘要】
一种四足机器人运动控制方法、系统、存储介质及设备


[0001]本专利技术属于自适应控制
,尤其涉及一种四足机器人运动控制方法、系统、存储介质及设备。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]传统的四足机器人控制方法往往需要提前对机器人进行精确的动力学和运动学建模分析,使用期望轨迹和足端反馈力反向求解每个关节驱动器需要执行的角度和力矩,这个过程需要大量的专业知识和漫长的手动设计过程,设计一个四足机器人敏捷运动的鲁棒控制器是有难度的。而且现实中会存在延迟和噪声干扰,四足机器人的模型分析往往不够精确,增加模型分析和系统控制的难度,如何使机器人具备自主学习运动的能力,实现四足机器人运动的自适应控制,是当前急需解决的难点之一。
[0004]深度强化学习技术结合了深度学习的感知能力和强化学习的决策能力,近些年来在众多领域取得许多突破性的成绩。机器人的运动规划和控制任务可以描述为一个感知和决策问题,所以深度强化学习的方法在机器人的运动控制领域是一种非常有前途的技术,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种四足机器人运动控制方法,其特征在于,包括:获取四足机器人在环境中行走时的状态,通过策略网络根据状态选择动作;获取四足机器人在环境中行走时的足端位置,以计算得到参考动作;结合参考动作与策略网络输出的动作,得到四足机器人执行的动作,发出动作指令至四足机器人,实现四足机器人的运动;所述四足机器人执行的动作表示为:其中,和分别表示所述参考动作和所述策略网络输出的动作,和分别表示参考动作的权重系数和策略网络输出的动作的权重系数。2.如权利要求1所述的一种四足机器人运动控制方法,其特征在于,所述状态包括四足机器人的俯仰角、横滚角、俯仰角速度、横滚角速度和各个关节的位置。3.如权利要求1所述的一种四足机器人运动控制方法,其特征在于,所述参考动作的计算方法为:确定四足机器人步态参数;基于四足机器人在环境中行走时的足端位置,结合步态参数,计算期望足端轨迹;期望足端轨迹经过逆运动学计算,得到参考动作。4.如权利要求3所述的一种四足机器人运动控制方法,其特征在于,所述期望足端轨迹为:其中,x(t)、y(t)和z(t)表示四足机器人t时刻时在机体坐标系中的期望足端位置,和表示四足机器人初始状态时足端在机体坐标系中的位置,表示腿摆动的步长,表示腿摆动的步高,表示单步的周期。5.如权利要求1所述的一种四足机器人运动控制方法,其特征在于,四足机器人执行动作后,状态发生转移,并获得奖励,将动作、奖励和转移前后的状态组合为转移元组存放在经验回放池中。6.如权利要求5所述的一种四足机器人运动控制方法,其特征在于,所述奖励采用奖励函数计算得到;所述奖励函...

【专利技术属性】
技术研发人员:李彬刘伟龙侯兰东杨姝慧徐一明张友梅张瑜张明亮
申请(专利权)人:齐鲁工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1