【技术实现步骤摘要】
本专利技术涉及机器人领域,尤其涉及一种四足机器人足部关节电机失力故障强化学习控制方法。
技术介绍
1、四足机器人,凭借其优异的地形穿越性和稳定性,越来越多的被运用在诸如消防、勘探、搜救、边防巡逻等领域。然而,在实际部署中,四足机器人的关节电机的健康状况往往会遭受各种挑战,包括但不限于物理损坏、功能障碍、电机老化等。由于其作业环境往往危险复杂,所以机器人遭遇如上损坏时,经常难以得到妥善的处理,造成工作进度落后,机器损坏,更有甚者可能会对操作者的生命健康产生威胁。因此关节电机故障鲁棒的控制算法至关重要,它不仅能够延长机器人的使用寿命和可靠性,同时也为机器人更广泛的应用打下基础。但传统的关节电机失力的鲁棒性控制策略往往具备无法回避的缺点,比如强依赖于开发设计人员的机器人运动学领域知识、密集的人力调整,而且这类方法的本质是预设另一套控制策略来应对特定情况,这使得它们面对新场景新任务时往往显得泛化能力不足。
2、近期关于利用强化学习实现机器人控制的专利技术:申请号为cn201610363756.1的中国专利技术专利申请《基于模型相关强
...【技术保护点】
1.一种四足机器人足部关节电机失力故障强化学习控制方法,其特征在于,包括两阶段的学习架构,探索学习阶段和策略整合阶段。
2.如权利要求1所述的四足机器人足部关节电机失力故障强化学习控制方法,其特征在于,所述探索学习阶段利用先验信息优化探索空间,得到每个故障情况的最优解。
3.如权利要求1所述的四足机器人足部关节电机失力故障强化学习控制方法,其特征在于,所述策略整合阶段将多种故障情况的鲁棒性操作整合在单一模型中。
4.如权利要求1所述的四足机器人足部关节电机失力故障强化学习控制方法,其特征在于,所述探索学习阶段中,不同电机故障对应的智
...【技术特征摘要】
1.一种四足机器人足部关节电机失力故障强化学习控制方法,其特征在于,包括两阶段的学习架构,探索学习阶段和策略整合阶段。
2.如权利要求1所述的四足机器人足部关节电机失力故障强化学习控制方法,其特征在于,所述探索学习阶段利用先验信息优化探索空间,得到每个故障情况的最优解。
3.如权利要求1所述的四足机器人足部关节电机失力故障强化学习控制方法,其特征在于,所述策略整合阶段将多种故障情况的鲁棒性操作整合在单一模型中。
4.如权利要求1所述的四足机器人足部关节电机失力故障强化学习控制方法,其特征在于,所述探索学习阶段中,不同电机故障对应的智能体在预设了失力故障的模拟环境中,任意探索可以得到最大奖励的的行为模式,最终选择收敛到最优表现的策略作为电机对应的单电机鲁棒策略。
5.如权利要求1所述的四足机器人足部关节电机失力故障强化学习控制方法,其特征在于,所述策略整合阶段中,先通过引入的非均衡采样机制选...
【专利技术属性】
技术研发人员:张伟楠,吴欣远,董文韬,温颖,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。