一种基于特权知识蒸馏的四足机器人运动规划方法技术

技术编号:37767928 阅读:28 留言:0更新日期:2023-06-06 13:29
本发明专利技术公开了一种基于特权知识蒸馏的四足机器人运动规划方法,首先在PyBullet中构建仿真环境,包括四足机器人动力学建模与复杂地形建模;之后分两阶段分别训练具有特权信息的教师网络与仅利用本体感知的学生网络;对于教师网络,基于PPO算法设计四足机器人的状态更新网络、动作执行网络以及奖励函数等,除了本体感知,还需输入地形信息、接触状态等特权信息,输出足端位置残差,并结合先验步态计算足端目标位置,对机器人进行控制;对于学生网络,使用能够容纳长历史的TCN编码器,通过模仿教师行为监督训练,学生网络能够从历史本体感知中推断出地形信息进行决策。本发明专利技术使四足机器人能够在真实环境中仅利用本体感知快速稳定的穿越多种非结构化复杂地形。的穿越多种非结构化复杂地形。的穿越多种非结构化复杂地形。

【技术实现步骤摘要】
一种基于特权知识蒸馏的四足机器人运动规划方法


[0001]本专利技术属于机器人
,具体涉及一种四足机器人运动规划方法。

技术介绍

[0002]长期以来,轮式机器人由于成本低、运动效率高、移动速度快等优点,受到各行各业的青睐,在送快递、送餐等场景中得到了很多应用。然而,轮式机器人只能在平坦路面上移动,但有些任务场景需要机器人具备在复杂崎岖路况中运动的能力。四足机器人对非结构化复杂地形具有更强的适应性和更小的地形破坏性,其在救援救灾、物资运输等非结构化场景中具有良好的应用前景。
[0003]当前四足机器人的设计和开发都是以传统仿生机器人学理论为基础,其主要特点是控制方法依赖机器人的动力学模型、机器人的步态模仿四足生物的运动步态、以人操控为主导的运动模式等。但此类方法需要对机器人运动学和动力学精确地建模分析,设计四足机器人的敏捷运动需要大量的专业知识和繁琐的手动调参。
[0004]近年来,随着深度学习技术日趋成熟,结合深度神经网络的强化学习方法突破了连续高维空间计算量的限制,在诸多领域中取得了优于传统方法的效果。深度强化学习的快本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于特权知识蒸馏的四足机器人运动规划方法,其特征在于,包括以下步骤:步骤1:搭建仿真环境;利用PyBullet物理引擎构建仿真环境,包括多种地形建模以及机器人动力学建模;使用域随机化方法随机机器人动力学参数,包括机体质量、关节质量、摩擦、惯性参数,并增加额外力和额外扭矩作为扰动,增强模型抗干扰能力;步骤2:设计教师网络的状态空间、动作空间及奖励函数;状态空间:状态定义为S
t
:=<o
t
,x
t
>,其中o
t
是机器人的观察向量,x
t
是特权信息;o
t
包含命令、方向、基本扭曲、关节位置、速度、φ
i
向量、f
i
向量和机械脚的位置;在编码腿部相位时,使用<cos(φ),sin(φ)>取代φ,获得平滑且唯一的角度表示;x
t
包含直接从物理引擎接收到的无噪声信息,包括与地形相互作用相关的信息;动作空间:动作定义为四个足端的目标位置残差,目标位置残差与先验步态生成器得到的先验足端位置相加,得到四足机器人的目标足端位置;奖励空间:包括指令跟踪、稳定性和碰撞三方面;指令跟踪包括线速度奖励、偏航角奖励、垂直速度惩罚;稳定性包括动作平滑度奖励、位姿惩罚、足端溜滑惩罚、关节约束惩罚、扭矩惩罚、俯仰角惩罚;碰撞包括机身碰撞与足端碰撞两部分;步骤3:训练基于PPO算法的强化学习教师网络;在每个训练轮次中,从平地、台阶、离散台阶、斜坡、丘陵、楼梯六类地形中随机选择一种地形进行训练;特权教师网络输入为本体感知与特权信息,输出为足端位置残差,...

【专利技术属性】
技术研发人员:郭斌李梦媛刘思聪徐若楠刘佳琪於志文
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1