【技术实现步骤摘要】
足式机器人的控制方法、装置、足式机器人及介质
[0001]本申请实施例涉及机器人控制领域,特别涉及一种足式机器人的控制方法、装置、足式机器人及介质。
技术介绍
[0002]足式机器人被广泛应用于探险救援、工业生产和医疗辅助等场景。在各种使用场景中,足式机器人的灵活性与稳定性也面临着更高的要求。
[0003]相关技术中,足式机器人可以获取本体感知信息,基于本体感知信息结合足部轨迹生成器进行运动控制,使得足式机器人可以在未知的地形条件下进行运动控制,并仍保持运动的稳健性。
[0004]然而,现有足式机器人由于缺少地形感知的输入,只能处理一些较简单的地形,如泥泞地等,对于复杂地形,比如梅花桩,有间隙的地形等,地形适应性较差,进而导致足式机器人在复杂环境下运动时的灵活性和稳定性不高。
技术实现思路
[0005]本申请实施例提供了一种足式机器人的控制方法、装置、足式机器人及介质,能够提高足式机器人在复杂环境下运动时的灵活性和稳定性。所述技术方案如下:
[0006]一方面,本申请实施例提供了一种足式机器人的控制方法,所述方法包括:
[0007]获取本体感知信息和外部感知信息,所述本体感知信息用于表征足式机器人本体的运动状态,所述外部感知信息用于表征所述足式机器人周围的环境信息;
[0008]将所述本体感知信息和所述外部感知信息输入深度神经网络,得到所述深度神经网络输出的第一预测残差,所述第一预测残差用于修正足部轨迹生成器的轨迹生成参数;
[0009]基于所述第一预测 ...
【技术保护点】
【技术特征摘要】
1.一种足式机器人的控制方法,其特征在于,所述方法包括:获取本体感知信息和外部感知信息,所述本体感知信息用于表征足式机器人本体的运动状态,所述外部感知信息用于表征所述足式机器人周围的环境信息;将所述本体感知信息和所述外部感知信息输入深度神经网络,得到所述深度神经网络输出的第一预测残差,所述第一预测残差用于修正足部轨迹生成器的轨迹生成参数;基于所述第一预测残差对所述足部轨迹生成器进行参数调整;基于参数调整后的所述足部轨迹生成器输出的关节运动参数,控制所述足式机器人的运动状态。2.根据权利要求1所述的方法,其特征在于,所述第一预测残差包括步频残差和抬腿高度残差,所述足部轨迹生成器的轨迹生成参数包括步频参数和抬腿高度参数;所述基于所述第一预测残差对所述足部轨迹生成器进行参数调整,包括:基于所述步频残差修正基准步频,得到调整后的步频参数;基于所述抬腿高度残差修正基准抬腿高度,得到调整后的抬腿高度参数。3.根据权利要求2所述的方法,其特征在于,所述深度神经网络的输出还包括第二预测残差,所述第二预测残差用于修正所述足部轨迹生成器输出的关节运动参数;所述基于参数调整后的所述足部轨迹生成器输出的关节运动参数,控制所述足式机器人的运动状态,包括:获取参数调整后的所述足部轨迹生成器输出的所述关节运动参数;基于所述第二预测残差修正所述关节运动参数;基于修正后的所述关节运动参数控制所述足式机器人的运动状态。4.根据权利要求3所述的方法,其特征在于,所述深度神经网络为LSTM网络,所述获取本体感知信息,包括:将接收到的移动方向指令、所述足式机器人的历史运动参数以及历史预测残差作为所述本体感知信息,所述历史预测残差包括所述深度神经网络的输出的历史第一预测残差以及历史第二预测残差。5.根据权利要求1所述的方法,其特征在于,所述获取外部感知信息,包括:获取所述足式机器人的足部周围的第一地形高度图;将所述第一地形高度图作为所述外部感知信息;或者,获取所述足式机器人参考位置下方的特定形状区域的第二地形高度图;将所述第二地形高度图作为所述外部感知信息。6.根据权利要求5所述的方法,其特征在于,所述获取所述足式机器人的足部周围的第一地形高度图,包括:以所述足式机器人的足部为中心,基于至少两种采样半径进行地面高度采样,得到多个地面采样点高度;基于足部高度与地面采样点高度之间的差值,生成所述第一地形高度图。7.根据权利要求1至6任一所述的方法,其特征在于,所述方法还包括:获取样本本体感知信息和样本外部感知信息;将所述样本本体感知信息和所述样本外部感知信息输入所述深度神经网络,得到所述
深度神经网络输出的样本预测残差;基于所述样本预测残差对所述足部轨迹生成器进行参数调整;基于参数调整后的所述足部轨迹生成器输出的样本关节运动参数,控制所述足式机器人的运动状态;基于所述运动状态确定运动奖励;基于所述运动奖励通过强化学习方式训练所述深度神经网络。8.根据权利要求7所述的方法,其特征在于,所述运动奖励包括:指令内速度奖励和指令外速度奖励,所述指令内速度奖励和所述指令外速度奖励用于鼓励所述足式机器人沿期望的方向移动;所述基于所述运动状态确定运动奖励,包括:获取所述足式机器人的本体速度以及移动方向指令所指示的移动方向;在所述本体速度大于期望速度下限且小于期望速度上限的情况下,将默认奖励值确定第一速度奖励值;将所述第一速度奖励值作为所述指令内速度奖励;或,在所述本体速度小于所述期望速度下限的情况下,基于所述本体速度、所述移动方向和所述期望速度下限确定第二速度奖励值;将所述第二速度奖励值作为所述指令内速度奖励,所述第二速度奖励值小于所述默认奖励值;或,在所述本体速度大于所述期望速度上限的情况下,基于所述本体速度、所述移动方向和所述期望速度上限确定第三速度奖励值;将所...
【专利技术属性】
技术研发人员:李珽光,石豪杰,朱庆旭,韩磊,迟万超,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。