【技术实现步骤摘要】
面向多非完整约束移动机器人系统的智能任务监管方法
[0001]本专利技术涉及智能机器人
,特别是面向多非完整约束移动机器人系统的智能任务监管方法。
技术介绍
[0002]近年来,由于非完整约束在实际系统中很常见,非完整约束移动机器人引起了广泛的关注。通过群体智能技术,多非完整约束移动机器人可以实现比个体更好的任务性能。因为任务目标通常很复杂,所以非完整约束移动机器人不得不同时执行多个冲突任务。众所周知,多任务冲突消解是多智能体系统领域的一个开放问题。行为控制通过建模和融合行为提供了一种实用的方法。特别是,一种名为零空间行为控制(Null
‑
Space
‑
based Behavioral Control,NSBC)方法不仅实现了最高优先级的行为,而且还在其零空间上执行部分低优先的行为。一般来说,需要确定的行为优先级来完成零空间投影,且每个单独的行为优先级由一个名为任务监管器的模块预先确定。
[0003]尽管如此,在早期的工作中,行为优先级是固定的和预先设置的,这导致了零空间行为 ...
【技术保护点】
【技术特征摘要】
1.面向多非完整约束移动机器人系统的智能任务监管方法,其特征在于:包括以下步骤:步骤S1,在零空间行为控制方法的行为设计框架内,引入非完整约束,推导具有非完整约束零空间行为控制的行为设计范式NSBC
‑
NCs,并在该范式的基础上完成多非完整约束移动机器人系统的基本行为设计,同时通过零空间投影技术,将所设计的基本行为以不同的优先级顺序组合成为多非完整约束移动机器人的复合行为;步骤S2,创新性地将零空间行为控制的行为切换问题建模为一个协作式马尔科夫博弈问题,设置复合行为的参考速度指令作为强化学习算法的动作集合,选取多非完整约束机器人的位置、速度和势场值等为强化学习算法的状态集合,设计合理的奖励函数,从而构建多智能体强化学习任务监管器MARLMS;步骤S3,以跟踪性能和惰性惩罚为指标构建优化问题的代价函数,设置动力学模型和避障为优化问题的约束,从而设计模型预测冗余规划器MPCRR。2.根据权利要求1所述的面向多非完整约束移动机器人系统的智能任务监管方法,其特征在于,所述步骤S1具体为:步骤S11:非完整约束移动机器人运动学建模考虑一排N(N>2)的非完整约束移动机器人,其中每个智能体均有2个辅助轮和2个驱动轮;i=1,...,N;第i个非完整约束移动机器人的线速度v
i
和角速度ω
i
分别表示为分别表示为其中,和分别是左右驱动轮的速度,是左右驱动轮间的距离,表示实数集合;定义第i个非完整约束移动机器人的位置和方向分别为和那么第i个非完整约束移动机器人的运动学方程建模为其中,分别是广义的位置和速度,是非完整约束矩阵;假设1:多非完整约束移动机器人系统工作在一个静态的场景中,其中所有障碍物是静态但非固定的,部分障碍物是未知的;假设2:多非完整约束移动机器人系统是一个小规模的多智能体系统,例如(N≤20);步骤S12:具有非完整约束的零空间行为控制范式推导假设每一个非完整约束移动机器人均有M个基本行为,其中第i个非完整约束移动机器人的第j个基本行为可以使用一个任务变量人的第j个基本行为可以使用一个任务变量进行数学建模如下
其中,为任务函数;然后,任务变量的微分形式表示为其中,表示任务的雅克比矩阵;最后,第i个非完整约束移动机器人的第j个基本行为的参考速度指令表示为其中,是J
i,j
的右伪逆矩阵,是期望的任务,是任务的增益,是任务的误差;步骤S13:基本行为的设计在不失一般性的前提下,编队保持、编队重构和避障行为设计如下:编队保持行为FM:编队保持行为旨在驱使多非完整约束移动机器人系统去形成和维持一个期望的队形,相应的任务函数、期望任务和任务雅克比矩阵分别表示为:相应的任务函数、期望任务和任务雅克比矩阵分别表示为:相应的任务函数、期望任务和任务雅克比矩阵分别表示为:其中,是第i个非完整约束移动机器人的位置,是第1个非完整约束移动机器人的位置,是第1个非完整约束移动机器人的期望编队任务函数,是第1个非完整约束移动机器人与第i个非完整约束移动机器人的编队相对位置,是编队行为期望的方向;编队重构行为FR:编队重构行为旨在驱使多非完整约束移动机器人系统去重构一个期望的队形,相应的任务函数、期望任务和任务雅克比矩阵分别表示为:任务函数、期望任务和任务雅克比矩阵分别表示为:任务函数、期望任务和任务雅克比矩阵分别表示为:其中,是第1个非完整约束移动机器人的期望重构任务函数;避障行为OA:避障行为旨在驱使多非完整约束移动机器人系统去避开路径附近的障碍物,相应的任务函数、期望任务和任务雅克比矩阵分别表示为:
其中,是第i个非完整约束移动机器人与障碍物的最小距离,d
OA
为安全距离,为安全距离,是最小距离的相对位置,是避障行为期望的方向,+和
‑
分别表示障碍物在第i个非完整约束移动机器人的左边和右边;步骤S14:复合行为的设计一个复合任务是多个基本行为以一定的优先级顺序的组合;设定为第i个非完整约束移动机器人的任务函数,其中j
m
∈N
M
,N
M
={1,...,M},m
j
表示任务空间的维度,M表示任务的数量;定义与时间相关的优先级函数g
i
(j
m
,t):N
M
×
[0,∞]
→
N
M
;同时,定义一个具有如下规则的任务层次结构:1)一个具有g
i
(j
α
)优先级的任务j
α
不能干扰具有g
i
(j
β
)优先级的任务j
β
,如果g
i
(j
α
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。