基于模仿学习的人形机器人多运动切换控制方法及系统技术方案

技术编号：44333298 阅读：17 留言：0更新日期：2025-02-18 20:42

本发明专利技术提出基于模仿学习的人形机器人多运动切换控制方法及系统，以生成式对抗网络为基础进行模仿学习，通过人形机器人执行各项运动技能的表现情况动态调整对每个运动技能的采样概率，以使所述人形机器人均匀的掌握不同运动技能，实现人形机器人能够集成不同的运动技能组合，并有效地减缓了模式坍塌问题的严重程度，具有良好的灵活性和可扩展性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于模仿学习相关，尤其涉及基于模仿学习的人形机器人多运动切换控制方法及系统。

技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。

2、随着人形机器人的日益普及，人们对其功能增强的需求将持续增长。其中一个主要的需求是要求人形机器人能够同时掌握多种不同的运动技能，以更好地应对现实世界应用中的各种不同的场景和任务。这一需求使人形机器人的多运动技能集成成为人形机器人运动控制领域近期的研究热点。多运动技能集成旨在将诸如站立、行走、奔跑、跳跃等多种不同的运动技能集成到人形机器人的单个或多个运动控制器上，并使其能够灵活地在不同的运动技能之间进行切换。

3、在人形机器人的运动控制领域，现有基于学习的技术主要包括基于强化学习和基于模仿学习两个主流方向。基于强化学习的方法对人形机器人形态的适应性更强，不同运动技能之间的差异是导致现有基于强化学习的方法需要依赖奖励工程的主要原因。对于相似程度较高的运动技能，如行走、奔跑等，往往可以使用一组相似的奖励函数辅助其训练学习；而对于差异较大的运...

【技术保护点】

1.基于模仿学习的人形机器人多运动切换控制方法，其特征在于，包括：

2.如权利要求1所述的基于模仿学习的人形机器人多运动切换控制方法，其特征在于，所述运动控制模型的构建，具体为：

3.如权利要求2所述的基于模仿学习的人形机器人多运动切换控制方法，其特征在于，所述条件判别器的训练过程具体为：

4.如权利要求2所述的基于模仿学习的人形机器人多运动切换控制方法，其特征在于，采用时间差分方式进行反向传播，利用Adam优化器更新值网络参数。

5.如权利要求1所述的基于模仿学习的人形机器人多运动切换控制方法，其特征在于，所述人形机器人的本体状态包括质心...

【技术特征摘要】

1.基于模仿学习的人形机器人多运动切换控制方法，其特征在于，包括：

2.如权利要求1所述的基于模仿学习的人形机器人多运动切换控制方法，其特征在于，所述运动控制模型的构建，具体为：

3.如权利要求2所述的基于模仿学习的人形机器人多运动切换控制方法，其特征在于，所述条件判别器的训练过程具体为：

4.如权利要求2所述的基于模仿学习的人形机器人多运动切换控制方法，其特征在于，采用时间差分方式进行反向传播，利用adam优化器更新值网络参数。

5.如权利要求1所述的基于模仿学习的人形机器人多运动切换控制方法，其特征在于，所述人形机器人的本体状态包括质心线速度、质心角速度、质心朝向、关节位置和关节角速度。

6.如权利要求1所述的基于模仿学习的人形...

【专利技术属性】
技术研发人员：宋然，廖鸿浩，张伟，李智亨，谭文浩，方兴，李晓磊，
申请(专利权)人：山东大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人