当前位置: 首页 > 专利查询>嘉应学院专利>正文

一种基于HADQN的多机器人任务分配方法组成比例

技术编号:32220131 阅读:42 留言:0更新日期:2022-02-09 17:25
本发明专利技术公开了一种基于HADQN的多机器人任务分配方法,包括:确定环境状态和动态探索因子;根据环境状态和动态探索因子,制定机器人的动作选择策略;根据制定的机器人的动作选择策略,完成轨迹池的构建和更新;根据更新后的轨迹池,对DQN算法中的经验池进行更新,得到更新后的经验池数据;根据更新后的经验池数据,对DQN算法中的全局估计值网络的参数进行训练和更新,进而进行多机器任务分配算法的任务规划。本发明专利技术解决了复杂环境下多机器人多任务分配问题时面临的维度灾难问题,并在进行任务分配的同时对局部路径进行规划,保证了机器人能够避开环境中障碍物的同时机器人选择的路径相对较优。相对较优。相对较优。

【技术实现步骤摘要】
一种基于HADQN的多机器人任务分配方法


[0001]本专利技术属于机器任务分配
,尤其涉及一种基于HADQN的多机器人任务分配方法。

技术介绍

[0002]近年来,由于移动机器人可以在人类不可到达的地方完成任务,已经被成功地运用到了很多领域,如战场侦察、星球探测等领域。在机器人核心研究领域,特别是多机器人系统的研究中,多机器人协作是其中很重要的一部分,其中多机器人任务分配(Multi

robot Task Allocation,MRTA)又占据主要的地位,利用多机器人协作探索未知环境与单个机器人系统相比具有信息冗余、柔韧性、并行性等特点,但在未知环境下也面临多任务分配、有线通信和信息融合等挑战。
[0003]然而,传统的多机器人任务分配方案,需要根据不同的任务环境选择不同的分配策略,并且在必要的情况下需要对策略进行完善和优化,无法适应所有的任务环境。
[0004]随着人工智能的兴起,很多基于人工智能的任务分配方法被提出,比较典型的方法有遗传算法等。这些基于人工智能的任务分配方法具有一定智能性,在面对不本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于HADQN的多机器人任务分配方法,其特征在于,包括:确定环境状态和动态探索因子;根据环境状态和动态探索因子,制定机器人的动作选择策略;根据制定的机器人的动作选择策略,完成轨迹池的构建和更新;根据更新后的轨迹池,对DQN算法中的经验池进行更新,得到更新后的经验池数据;根据更新后的经验池数据,对DQN算法中的全局估计值网络的参数进行训练和更新,进而进行多机器任务分配算法的任务规划。2.根据权利要求1所述的基于HADQN的多机器人任务分配方法,其特征在于,确定环境状态,包括:根据机器人的当前位置,确定机器人与障碍物之间的实时相对位置;根据机器人与障碍物的实时相对位置,得到机器人与障碍物之间的实时相对状态;根据机器人与障碍物之间的实时相对状态,得到环境状态;其中,环境状态,包括:游离状态、半成功状态、失败状态和完成状态。3.根据权利要求1所述的基于HADQN的多机器人任务分配方法,其特征在于,获取的动态探索因子的表达式如下:其中,ε表示动态探索因子;ε
final
为一个实数,表示动态探索因子的最终稳定值,0≤ε
final
<1;ε0为一个实数,表示动态探索因子的初始值,ε
final
≤ε0≤1;episode为一个整数变量,表示当前迭代次数,0≤episode≤max_episode,max_episode表示最大迭代次数;ζ为一个实数,表示动态系数,0<ζ<1。4.根据权利要求3所述的基于HADQN的多机器人任务分配方法,其特征在于,制定的机器人的动作选择策略如下:其中,π
D
(s)表示动作选择策略,q为0到1之间的随机数,Q(s,(a1,...,a
n
)|w)表示Q_eval网络,w表示Q_eval网络的权重,s表示环境状态,(a1,...,a
n
)
random
表示从机器人的执行动作集合{a1,...,a
n
}中随机选择的一个联合动作,表示选择环境状态s下Q值最大的联合动作对,a
i
表示机器人的执行动作i,1≤i≤n,n表示机器人的执行动作总数。5.根据权利要求4所述的基于HADQN的多机器人任务分配...

【专利技术属性】
技术研发人员:张子迎陈云飞王宇华刘心陈玉炜
申请(专利权)人:嘉应学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1