【技术实现步骤摘要】
本申请涉及机器人控制,更具体的说,是涉及一种机器人转身及下蹲稳定站立控制方法、装置、设备及存储介质。
技术介绍
1、随着机器人技术的应用和发展,机器人逐渐从工业领域向服务、娱乐、教育等领域渗透,当前比较热门的研究方向如人形机器人。人形机器人通过程序控制,可以执行一些设定的动作。
2、以往的对人形机器人的动作控制通常采用一些比较传统的算法,如pid算法等,在测试阶段需要在真机上验证并调优算法,这个过程不可避免的会由于算法的缺陷给机器人带来不利影响,严重时甚至给机器人硬件带来不可逆的损伤,极大浪费了硬件设备资源。且,传统算法的控制效果也不佳,尤其是在机器人转身和下蹲的过程,无法很好的保持机器人的稳定站立。
技术实现思路
1、鉴于上述问题,提出了本申请以便提供一种机器人转身及下蹲稳定站立控制方法、装置、设备及存储介质,以实现对人形机器人转身及下蹲过程站立稳定性的控制。具体方案如下:
2、第一方面,提供了一种机器人转身及下蹲稳定站立控制方法,包括:
3、获取目标
...【技术保护点】
1.一种机器人转身及下蹲稳定站立控制方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述策略网络在所述仿真器中的训练过程,包括:
3.根据权利要求2所述的方法,其特征在于,所述特权信息包括地形高度信息。
4.根据权利要求1所述的方法,其特征在于,所述本体感知信息包括:
5.根据权利要求1所述的方法,其特征在于,所述策略网络输出的n维动作包括:n个关节各自相对于默认关节位置的相对位置变化。
6.根据权利要求2所述的方法,其特征在于,所述强化学习的奖励函数还包括以下任意一项或多项奖励函数,由所
...【技术特征摘要】
1.一种机器人转身及下蹲稳定站立控制方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述策略网络在所述仿真器中的训练过程,包括:
3.根据权利要求2所述的方法,其特征在于,所述特权信息包括地形高度信息。
4.根据权利要求1所述的方法,其特征在于,所述本体感知信息包括:
5.根据权利要求1所述的方法,其特征在于,所述策略网络输出的n维动作包括:n个关节各自相对于默认关节位置的相对位置变化。
6.根据权利要求2所述的方法,其特征在于,所述强化学习的奖励函数还包括以下任意一项或多项奖励函数,由所有的奖励函数通过加权求和作为总奖励函数:
7.根据...
【专利技术属性】
技术研发人员:倪婧菲,刘迪源,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。