一种四足机器人足部关节电机失力故障强化学习控制方法技术

技术编号：41660579 阅读：48 留言：0更新日期：2024-06-14 15:21

本发明专利技术公开了一种四足机器人足部关节电机失力故障强化学习控制方法，涉及机器人领域。本发明专利技术提出两阶段的算法，由探索学习阶段和策略整合阶段组成。探索学习阶段利用先验信息优化探索空间，得到每个子情况的最优解，策略整合阶段将多种故障情况的鲁棒性操作整合在单一模型中。本发明专利技术能够在只利用机器人自身感受器的信息输入的前提下，不依赖开发人员机器人运动学领域先验知识的情况，敏捷地开发出可以适应足部关节电机各种程度失力故障的机器人的鲁棒性控制方法，并在功能表现上具备一定的泛化性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及机器人领域，尤其涉及一种四足机器人足部关节电机失力故障强化学习控制方法。

技术介绍

1、四足机器人，凭借其优异的地形穿越性和稳定性，越来越多的被运用在诸如消防、勘探、搜救、边防巡逻等领域。然而，在实际部署中，四足机器人的关节电机的健康状况往往会遭受各种挑战，包括但不限于物理损坏、功能障碍、电机老化等。由于其作业环境往往危险复杂，所以机器人遭遇如上损坏时，经常难以得到妥善的处理，造成工作进度落后，机器损坏，更有甚者可能会对操作者的生命健康产生威胁。因此关节电机故障鲁棒的控制算法至关重要，它不仅能够延长机器人的使用寿命和可靠性，同时也为机器人更广泛的应用打下基础。但传统的关节电机失力的鲁棒性控制策略往往具备无法回避的缺点，比如强依赖于开发设计人员的机器人运动学领域知识、密集的人力调整，而且这类方法的本质是预设另一套控制策略来应对特定情况，这使得它们面对新场景新任务时往往显得泛化能力不足。

2、近期关于利用强化学习实现机器人控制的专利技术：申请号为cn201610363756.1的中国专利技术专利申请《基于模型相关强...

【技术保护点】

1.一种四足机器人足部关节电机失力故障强化学习控制方法，其特征在于，包括两阶段的学习架构，探索学习阶段和策略整合阶段。

2.如权利要求1所述的四足机器人足部关节电机失力故障强化学习控制方法，其特征在于，所述探索学习阶段利用先验信息优化探索空间，得到每个故障情况的最优解。

3.如权利要求1所述的四足机器人足部关节电机失力故障强化学习控制方法，其特征在于，所述策略整合阶段将多种故障情况的鲁棒性操作整合在单一模型中。

4.如权利要求1所述的四足机器人足部关节电机失力故障强化学习控制方法，其特征在于，所述探索学习阶段中，不同电机故障对应的智能体在预设了失力故障...

【技术特征摘要】

1.一种四足机器人足部关节电机失力故障强化学习控制方法，其特征在于，包括两阶段的学习架构，探索学习阶段和策略整合阶段。

4.如权利要求1所述的四足机器人足部关节电机失力故障强化学习控制方法，其特征在于，所述探索学习阶段中，不同电机故障对应的智能体在预设了失力故障的模拟环境中，任意探索可以得到最大奖励的的行为模式，最终选择收敛到最优表现的策略作为电机对应的单电机鲁棒策略。

5.如权利要求1所述的四足机器人足部关节电机失力故障强化学习控制方法，其特征在于，所述策略整合阶段中，先通过引入的非均衡采样机制选...

【专利技术属性】
技术研发人员：张伟楠，吴欣远，董文韬，温颖，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人