一种基于强化学习的六足机器人容错步态规划方法技术

技术编号：38229224 阅读：16 留言：0更新日期：2023-07-25 17:58

本发明专利技术公开了一种基于强化学习的六足机器人容错步态规划方法，包括以下步骤：搭建六足机器人的仿真模型；建立基于改进的Hopf振荡器的CPG步态生成器；融合仿真模型、策略网络与基于改进的Hopf振荡器的CPG步态生成器，构建强化学习运动控制框架，对于建立的六足机器人仿真模型，融合强化学习运动控制框架；模拟六足机器人部分腿出现故障，在仿真环境中冻结六足机器人出现故障的腿，对强化学习运动控制框架进行训练；将训练后的控制网络集成在六足机器人的步态控制框架中，用于生成六足机器人的容错步态并验证，如果能在冻结故障腿的情况下完成自主运动则表示策略网络有效，从而将策略网络提取出来用于控制真实的六足机器人运动。网络提取出来用于控制真实的六足机器人运动。网络提取出来用于控制真实的六足机器人运动。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于强化学习的六足机器人容错步态规划方法

[0001]本专利技术涉及机器人控制领域，尤其涉及一种基于强化学习的六足机器人容错步态规划方法。

技术介绍

[0002]随着科技的发展，仿生机器人技术得到了迅速发展并已在医疗、工业、军事、航空等领域起到了巨大的作用。在众多的机器人中，六足机器人在非结构地形中具有更多的优势，包括对不规则地形的适应性和灵活性，因此六足机器人在一些特殊环境下具有更广泛的应用前景。然而，当机器人在危险或灾难环境中运动时，容易发生腿部失效故障并且无法及时进行人工修复，如果可以根据当前情况找到能够让腿部故障机器人继续运动的步态，则认为它对于给定的故障是容错的，这将会提高六足机器人在未知环境中的适用性，因此针对六足机器人的容错控制就显得尤为重要，这样可以保证机器人继续作业而不是任务彻底失败。
[0003]为了解决六足机器人的容错步态规划问题，当前已有的研究主要探索了在切换到固定的容错步态以适应腿部故障，如一种腿部可移动六足机器人腿部缺失的容错步态控制方法(CN109696824B)，或者研究在CPG控制器分层建模的基础上设计一种自适应容错步态生成器，根据腿部负载的变化延长或缩短支撑相来产生多种步态，如(尤波，李鲲鹏，李佳钰，刘大权.单腿失效的六足机器人失稳调整与容错步态设计[J].机械工程学报，2021，57(01)：100
‑
109.)，这些方法都需要很强的人工干预对参数进行调整以达到六足机器人的最佳步态，耗时费力也不一定能达到最佳的效果。强化学习作为一种新兴的算法，通过奖...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的六足机器人容错步态规划方法，其特征在于，包括以下步骤：S1、搭建六足机器人的仿真模型；S2、根据六足机器人的运动特点建立基于改进的Hopf振荡器的CPG步态生成器，步态生成器的输入为步态参数，输出为六足机器人的关节位置控制指令，以控制机器人按照步态生成器生成的步态进行运动；S3、融合仿真模型与步骤S2中基于改进的Hopf振荡器的CPG步态生成器，构建强化学习运动控制框架；S4、模拟六足机器人部分腿随机出现故障，在仿真环境中六足机器人故障腿设定为不能运动且无支撑力；对强化学习运动控制框架进行训练，获得控制网络的参数，使该框架能够控制六足机器人的仿真模型在部分腿出现故障之后在仿真场景下运动；S5、将训练后获得的控制网络集成在六足机器人的步态控制框架中，用于生成六足机器人的容错步态，并在仿真环境中进行验证，机器人能在出现腿部故障的情况下完成运动则表示策略网络有效，从而将策略网络提取出来用于控制真实的六足机器人运动。2.根据权利要求1所述的一种基于强化学习的六足机器人容错步态规划方法，其特征在于，步骤S2中，改进的Hopf振荡器的数学模型为：式中，ω为振荡器的频率；ω
stance
是支撑相频率；ω
swing
是摆动相频率；b为常数；β是占地系数；y为振荡器的状态变量。3.根据权利要求1所述的一种基于强化学习的六足机器人容错步态规划方法，其特征在于，步骤S2中，六足机器人六条腿的振荡器相互耦合，组成环型耦合网络CPG步态生成器的数学模型为：式中：λ是两个振荡器间的耦合强度参数；x
i
和y
i
是振荡器i的状态变量；x
j
和y
j
是振荡器j的状态变量；和是一阶导数；α是收敛速度系数；μ为振荡器幅值的平方；ω
i
为单个振荡器的频率；θ
ji
是振荡器i和j之间的相位差；ω
stance
是支撑相频率；ω
swing
是摆动相频率；b为常数。4.根据权利要求1所述的一种基于强化学习的六足机器人容错步态规划方法，其特征在于，步骤S2中，髋关节、膝关节与踝关节与振荡器的输出曲线之间的映射函数为：
式中:θ1、θ1、θ3分别为髋关节、膝关节与踝关节的转角，k0是髋关节的映射系数；k1、k2是膝关节的映射系数；k3是踝关节的映射系数，用来调节关...

【专利技术属性】
技术研发人员：魏武，邹扬忠，李达贤，李雨妮，柳雄顶，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人