【技术实现步骤摘要】
本专利技术涉及多机器人协同序列决策,尤其涉及一种多机器人协同搜索任务自适应角色选择方法及系统。
技术介绍
1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
2、多机器人协同区域搜索由于其广泛的应用是机器人领域一个较为基础的研究问题,例如火星探索、灾难响应、或城市搜索与救援等。不同于单机器人系统,多机器人系统因为其能在多机器人之间达成协同决策从而提高任务完成效率且能保持弹性决策等优势使其在时间较为紧迫的任务中有更大的优势。
3、在多机器人协同区域搜索任务决策的过程中,要求机器人执行协同构图(探索)的同时搜索更多的目标(覆盖)。在决策过程中,机器人需1)感知环境以收集更多关于目标的信息;2)营救目标;3)与其余机器人协同在较短时间内完成在已探索区域内营救更多目标。
4、处理复杂任务最有效的方式是分解为较小且较为简单的子任务。因此,过去很多研究集中将区域搜索任务分解为两个不同的子任务:探索和覆盖,并在不同的两个阶段完成。在分解的方法中,机器人首先选择一个由例如泰森多边形分解算
...【技术保护点】
1.一种多机器人协同搜索任务自适应角色选择方法,其特征在于,包括:
2.如权利要求1所述的一种多机器人协同搜索任务自适应角色选择方法,其特征在于,当机器人接受探索角色动作时,则期望机器人朝着局部感受野内离自己最近的边界点移动;当机器人接受覆盖角色时,则期望机器人朝着局部感受野内离自己最近的目标点移动。
3.如权利要求1所述的一种多机器人协同搜索任务自适应角色选择方法,其特征在于,机器人基于局部感知信息识别边界点或目标点,同时利用联合感知信息在探索与覆盖之间评估期望回报;具体的期望计算如下:
4.如权利要求1所述的一种多机器人协同搜索
...【技术特征摘要】
1.一种多机器人协同搜索任务自适应角色选择方法,其特征在于,包括:
2.如权利要求1所述的一种多机器人协同搜索任务自适应角色选择方法,其特征在于,当机器人接受探索角色动作时,则期望机器人朝着局部感受野内离自己最近的边界点移动;当机器人接受覆盖角色时,则期望机器人朝着局部感受野内离自己最近的目标点移动。
3.如权利要求1所述的一种多机器人协同搜索任务自适应角色选择方法,其特征在于,机器人基于局部感知信息识别边界点或目标点,同时利用联合感知信息在探索与覆盖之间评估期望回报;具体的期望计算如下:
4.如权利要求1所述的一种多机器人协同搜索任务自适应角色选择方法,其特征在于,为每个机器人定义探索奖励re和覆盖奖励rc,角色选择网络的奖励函数为rt=αre+βrc,α和β分别是探索和覆盖角色的奖励权重系数。
5.如权利要求1所述的一种多机器人协同搜索任务自适应角色选择方法,其特征在于,所述角色选择网络使用基于评论-演说家(actor-critic)r结构的集中式训练分布式执行架构,使用多智能体强化学习算法训练角色选择网络;在集中式训练阶段,actorr网络用于输出角色...
【专利技术属性】
技术研发人员:程吉禹,朱莉娜,刘跃虎,张伟,张浩,
申请(专利权)人:山东大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。