【技术实现步骤摘要】
一种矿井下多机器人的队形控制方法
[0001]本专利技术属于井下机器人控制应用
,尤其涉及一种矿井下多机器人的队形控制方法。
技术介绍
[0002][0003]随着科技的不断发展,机器人已经应用于各种场景,由于矿井下的场景比较复杂,多机器人系统需要不断地变换队形以适应不同的环境。多机器人控制优点是它可以为协同侦察、探测以及救援等任务创造有利条件,更加高效率的完成任务。队形控制是近几十年来的研究热点,已经有各种经典的编队控制方法被研究和应用,例如基于领导者
‑
跟随者、基于行为以及基于虚拟结构的方法。虽然这三种典型的控制策略已经应用于编队控制问题多年,但是基于领导者
‑
跟随者的控制方法中一旦领导者出现故障会导致编队的崩溃;基于行为的编队方法依靠于定性的行为规则,难以建立整个系统的定量模型,无法保证整个系统编队运动的稳定性;基于虚拟结构的方法需要中心节点进行集中式控制,不能够以分布式的形式实现。在过去的几十年里,共识理论引起了研究人员的注意。由于编队控制中也需要局部相邻相互作用,控制领域的 ...
【技术保护点】
【技术特征摘要】
1.一种矿井下多机器人的队形控制方法,其特征在于,包括以下步骤:a、首先,模拟井下复杂场景,建立多个不同场景地图,为多机器人系统训练提供场景地图数据,其中,多机器人系统中机器人的个数至少为2个且每个机器人为相同机器人;b、然后,针对井下场景地图,使用强化学习算法对机器人系统中的每一个机器人都进行队形变换的训练学习,使每个机器人都有决策整个系统队形的能力;c、待训练完成后,在运行过程中,为了减少整个机器人机器人系统的计算量,每次执行任务过程中,多机器人系统指定一个主机器人作为系统的决策者,主机器人对整体系统状态进行计算,其他机器人负责收到自己的指令,并准确执行,其中,主机器人用于收集其他机器人的状态和当前环境信息,根据环境判断下一时刻整体系统的队形,将任务目标位置发送给系统中的每个机器人,其他机器人用于获取主机器人发送的任务,收到指令后,执行,并将自己的状态信息发送给主机器人;d、若主机器人出现故障,则根据奖励值计算公式,计算出其余每个机器人的累积奖励值,多机器人系统中目标函数值最大的机器人,将其作为新的主机器人,重新进行队形和路径的规划,其中,奖励值计算公式为:其中,R代表每个机器人自身位置和目标位置的误差值,γ为折扣因子是介于[0,1]的常数,k为常数,t...
【专利技术属性】
技术研发人员:冯炫,程漫颖,苗思宇,严宁,兰巍,
申请(专利权)人:陕西建材科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。