一种集群机器人合作导航的多向课程学习训练方法及装置制造方法及图纸

技术编号:40420727 阅读:18 留言:0更新日期:2024-02-20 22:39
本发明专利技术涉及机器人导航技术领域,特别是指一种集群机器人合作导航的多向课程学习训练方法及装置。一种集群机器人合作导航的多向课程学习训练方法包括:使用训练任务进行训练,获得集群机器人性能表现;根据训练任务,通过多向交叉算子以及多向变异算子,获得阶段任务;根据集群机器人性能表现,使用原型评估方法对阶段任务进行评估,获得集群机器人适应度;根据集群机器人适应度以及阶段任务,获得新训练任务;对多智能体进行强化学习训练;通过训练完成集群机器人进行导航。本发明专利技术是一种基于多向课程强化学习高效、稳定的集群机器人合作导航方法。

【技术实现步骤摘要】

本专利技术涉及机器人导航,特别是指一种集群机器人合作导航的多向课程学习训练方法及装置


技术介绍

1、在机器人导航领域中,许多已有的技术可以对机器人的行为和策略进行高效建模,并利用其完成特定的导航任务。然而,已有的技术往往只能适用于独立机器人的导航任务中,当任务主体由单个机器人变为多个机器人所组成的机器人集群时,传统方法往往都不再适用。

2、在实际的导航任务中,机器人往往遇到的是人类无法预知到的机械运动或是环境不确定性问题。因此,在缺乏先验知识的稀疏奖励条件下,机器人将无法根据环境中策略执行的结果对自身行为进行修正,这直接导致了集群机器人自动导航的行为受到严重限制。

3、在较为复杂困难的导航场景中环境变化程度较大,导致集群机器人在进行合作导航时,推理得到的导航结果正确率较低。由于没有考虑到集群机器人中个体机器人之间的任务耦合现象,导致困难导航任务失败率高。从课程的评价的角度来看,在以往的集群机器人合作导航任务中,由于机器人自主导航的训练过程与方法中对应的课程生成器/排列器的训练过程同步进行,想要在每一个特定的时间步中给出精准的课程最本文档来自技高网...

【技术保护点】

1.一种集群机器人合作导航的多向课程学习训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种集群机器人合作导航的多向课程学习训练方法,其特征在于,所述多智能体性能表现是多智能体执行训练任务的成功率。

3.根据权利要求1所述的一种集群机器人合作导航的多向课程学习训练方法,其特征在于,所述根据所述训练任务,通过多向交叉算子以及多向变异算子,获得阶段任务,包括:

4.根据权利要求3所述的一种集群机器人合作导航的多向课程学习训练方法,其特征在于,所述多向交叉算子用于将训练任务中的每个任务向目标任务方向进行扩展。

5.根据权利要求3所述...

【技术特征摘要】

1.一种集群机器人合作导航的多向课程学习训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种集群机器人合作导航的多向课程学习训练方法,其特征在于,所述多智能体性能表现是多智能体执行训练任务的成功率。

3.根据权利要求1所述的一种集群机器人合作导航的多向课程学习训练方法,其特征在于,所述根据所述训练任务,通过多向交叉算子以及多向变异算子,获得阶段任务,包括:

4.根据权利要求3所述的一种集群机器人合作导航的多向课程学习训练方法,其特征在于,所述多向交叉算子用于将训练任务中的每个任务向目标任务方向进行扩展。

5.根据权利要求3所述的一种集群机器人合作导航的多向课程学习训练方法,其特征在于,所述多向变异算子用于对训练任...

【专利技术属性】
技术研发人员:马惠敏张可鹏
申请(专利权)人:北京科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1