【技术实现步骤摘要】
本专利技术属于模仿学习相关,尤其涉及基于模仿学习的人形机器人多运动切换控制方法及系统。
技术介绍
1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
2、随着人形机器人的日益普及,人们对其功能增强的需求将持续增长。其中一个主要的需求是要求人形机器人能够同时掌握多种不同的运动技能,以更好地应对现实世界应用中的各种不同的场景和任务。这一需求使人形机器人的多运动技能集成成为人形机器人运动控制领域近期的研究热点。多运动技能集成旨在将诸如站立、行走、奔跑、跳跃等多种不同的运动技能集成到人形机器人的单个或多个运动控制器上,并使其能够灵活地在不同的运动技能之间进行切换。
3、在人形机器人的运动控制领域,现有基于学习的技术主要包括基于强化学习和基于模仿学习两个主流方向。基于强化学习的方法对人形机器人形态的适应性更强,不同运动技能之间的差异是导致现有基于强化学习的方法需要依赖奖励工程的主要原因。对于相似程度较高的运动技能,如行走、奔跑等,往往可以使用一组相似的奖励函数辅助其训练学习;而对于差异较大的运
...【技术保护点】
1.基于模仿学习的人形机器人多运动切换控制方法,其特征在于,包括:
2.如权利要求1所述的基于模仿学习的人形机器人多运动切换控制方法,其特征在于,所述运动控制模型的构建,具体为:
3.如权利要求2所述的基于模仿学习的人形机器人多运动切换控制方法,其特征在于,所述条件判别器的训练过程具体为:
4.如权利要求2所述的基于模仿学习的人形机器人多运动切换控制方法,其特征在于,采用时间差分方式进行反向传播,利用Adam优化器更新值网络参数。
5.如权利要求1所述的基于模仿学习的人形机器人多运动切换控制方法,其特征在于,所述人形机器
...【技术特征摘要】
1.基于模仿学习的人形机器人多运动切换控制方法,其特征在于,包括:
2.如权利要求1所述的基于模仿学习的人形机器人多运动切换控制方法,其特征在于,所述运动控制模型的构建,具体为:
3.如权利要求2所述的基于模仿学习的人形机器人多运动切换控制方法,其特征在于,所述条件判别器的训练过程具体为:
4.如权利要求2所述的基于模仿学习的人形机器人多运动切换控制方法,其特征在于,采用时间差分方式进行反向传播,利用adam优化器更新值网络参数。
5.如权利要求1所述的基于模仿学习的人形机器人多运动切换控制方法,其特征在于,所述人形机器人的本体状态包括质心线速度、质心角速度、质心朝向、关节位置和关节角速度。
6.如权利要求1所述的基于模仿学习的人形...
【专利技术属性】
技术研发人员:宋然,廖鸿浩,张伟,李智亨,谭文浩,方兴,李晓磊,
申请(专利权)人:山东大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。