当前位置: 首页 > 专利查询>江南大学专利>正文

一种移动机器人变批次长度迭代学习优化控制方法技术

技术编号:27280308 阅读:16 留言:0更新日期:2021-02-06 11:47
本发明专利技术公开了一种移动机器人变批次长度迭代学习优化控制方法,涉及移动机器人优化控制领域;该方法基于提升技术将重复运行的移动机器人系统转换为时间序列的输入输出矩阵模型,并通过随机变量将变批次长度问题建立为批次长度随机变化模型;针对系统出现的批次长度变化情况,采用优化的思想设计迭代学习优化控制算法,并基于性能指标函数得到批次长度变化下迭代学习优化控制算法的前馈形式;基于逐次投影框架,证明了存在及不存在输入约束时所设计的迭代学习优化控制算法在数学期望意义下的收敛性。该方法解决了变批次长度下移动机器人系统的跟踪控制问题,同时考虑输入受约束的情况,从而实现对期望轨迹的高精度跟踪。从而实现对期望轨迹的高精度跟踪。从而实现对期望轨迹的高精度跟踪。

【技术实现步骤摘要】
一种移动机器人变批次长度迭代学习优化控制方法


[0001]本专利技术涉及移动机器人优化控制领域,尤其是一种移动机器人变批次长度迭代学习优化控制方法。

技术介绍

[0002]移动机器人可通过移动来完成一些繁重、危险、重复的任务,如地雷探测、海底探测、无人驾驶等,在工业、医疗、国防等很多领域都有实用价值。移动机器人有很多种,最常见的是在地面上依靠轮子移动的机器人。
[0003]移动机器人在执行重复过程任务时,受限于某些输出约束或在运行轨迹上出现障碍,不同批次的持续时长可能是变化的。比如移动机器人的位姿角被约束在一定输出范围内运行时,当移动机器人转动角度超出该限制范围,移动机器人将中断运行;又或者在某一批次中运行轨迹中出现障碍,使得移动机器人受迫停下,这些都会导致出现批次长度变化的情况。
[0004]批次长度变化问题的常用解决思路是设定一个期望的批次长度,在实际应用中,该期望批次长度一般设为可能出现的最大长度。若实际批次长度小于最大长度,则将该批次缺失的误差信息用零来补齐,那么批次长度变化问题就可以用常规的迭代学习控制(Iterative learning control,ILC)方法来解决。常规的ILC解决批次长度变化问题一般有两种:其一为采用高阶迭代学习控制方法,使用以往批次的误差及输入信息来更新输入信号,从而增强对于批次长度随机变化的鲁棒性。值得一提的是,一阶迭代学习控制律对于批次长度变化问题也具有较强的鲁棒性;其二为采用自适应迭代学习控制方法,在某次迭代过程中,先根据输出误差对系统的未知参数进行学习,再根据这些参数估计值更新系统的输入信号。然而,常规的ILC方法在处理批次长度变化问题时,由于批次长度的随机性,其收敛速度及单调性并不能得到良好保证。
[0005]优化ILC方法是一种将优化思想与ILC相结合的高性能控制方法,针对上述批次长度可变问题,优化ILC方法应运而生。

技术实现思路

[0006]本专利技术人针对上述问题及技术需求,提出了一种移动机器人变批次长度迭代学习优化控制方法,利用优化的思想来解决批次长度可变问题,通过引入逐次投影算法的思想来设计优化算法,并采用前馈结构来构造控制律,得到了单调收敛特性及更快的收敛速度,提升了系统对于批次长度可变情况的跟踪性能表现。
[0007]本专利技术的技术方案如下:
[0008]单机械臂变批次长度迭代学习优化控制方法,包括如下步骤:
[0009]建立双后轮独立驱动刚性移动机器人控制系统的动态模型;构建双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程;利用随机变量建立批次长度随机变化模型;设计批次长度可变的迭代学习轨迹跟踪优化算法;分析批次长度可变的迭代学习轨迹
跟踪优化算法的收敛性;在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法;分析输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性;实现批次长度可变的移动机器人控制系统在有输入约束情形下的轨迹跟踪;
[0010]第一步、建立双后轮独立驱动刚性移动机器人控制系统的动态模型:
[0011]双后轮独立驱动刚性移动机器人通过两个后轮的不同速度来控制移动机器人的速度和航向,在固定平面内设置绝对坐标XOY,假设双后轮独立驱动刚性移动机器人在固定平面内移动,移动机器人的实际物理模型如下:
[0012][0013]其中,v表示移动机器人的线速度,θ表示移动机器人的位姿角,u
r
和u
l
分别表示右轮和左轮的驱动控制输入,c表示黏性摩擦系数,k表示驱动增益,M1表示移动机器人的质量,I
w
表示车轮的转动惯量,I
v
表示绕机器人重心的转动惯量,r表示车轮半径,l表示左右轮到机器人重心的距离;
[0014]第二步、构建双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程:
[0015]将移动机器人的线速度、位姿角和位姿角导数定义为状态变量:定义输入变量为驱动控制输入:u=[u
r u
l
]T
,输出变量为移动机器人的线速度和位姿角:y=[vθ]T
,则式(1)所示的移动机器人控制系统描述为:
[0016][0017]其中,
[0018]对连续系统模型式(2)进行离散化,选取满足香农采样定理的采样周期T
s
,进一步得到移动机器人控制系统的离散状态空间模型:
[0019][0020]式中t和k分别代表采样时间和批次,批次过程的运行周期为T,且在每个重复过程周期t∈[0,T]内,取N
d
个采样点;u
k
(t)∈R
l
,y
k
(t)∈R
m
和x
k
(t)∈R
n
分别是移动机器人控制系统第k批次t时刻的l维输入、m维输出和n个状态向量;A,B,C为式(2)对应的离散系统参数矩阵,且满足CB≠0;并且假设系统运行的初始状态在围绕期望初始状态x
d
(0)的小范围内随机变化,其数学期望满足E{x
k
(0)}=x
d
(0);
[0021]第三步、利用随机变量建立批次长度随机变化模型:
[0022]针对式(3)形式的线性离散系统,将其状态空间表达式转换为时间序列的输入输
出矩阵模型:
[0023]y
k
=Gu
k
+d
k
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0024]其中:
[0025][0026][0027]u
k
=[u
k
(0),u
k
(1),...,u
k
(N
d-1)]T
[0028]y
k
=[y
k
(1),y
k
(2),...,y
k
(N
d
)]T
[0029]G是时间序列上的输入输出传递矩阵,d
k
是系统初始状态对输出的影响;输入Hilbert空间l
2l
[0,N
d
]和输出Hilbert空间l
2m
[0,N
d
]分别由如下内积及相关的诱导范数定义:
[0030][0031][0032]其中,分别为输入输出Hilbert空间上的向量,权矩阵R和为适当维数的实正定矩阵;
[0033]并且,定义期望输出y
d
∈l2[0,N
d
]为:
[0034]y
d
=[y
d
(1) y
d
(2)
ꢀ…ꢀ
y
d
(N
d
)]T
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种移动机器人变批次长度迭代学习优化控制方法,其特征在于,所述方法包括:建立双后轮独立驱动刚性移动机器人控制系统的动态模型;构建所述双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程;利用随机变量建立批次长度随机变化模型;设计批次长度可变的迭代学习轨迹跟踪优化算法;分析所述批次长度可变的迭代学习轨迹跟踪优化算法的收敛性;在输入约束下设计批次长度可变的迭代学习轨迹跟踪优化算法;分析所述输入约束下的批次长度可变的迭代学习轨迹跟踪优化算法的收敛性;实现批次长度可变的移动机器人控制系统在有输入约束情形下的轨迹跟踪;第一步、建立双后轮独立驱动刚性移动机器人控制系统的动态模型:所述双后轮独立驱动刚性移动机器人通过两个后轮的不同速度来控制移动机器人的速度和航向,在固定平面内设置绝对坐标XOY,假设所述双后轮独立驱动刚性移动机器人在所述固定平面内移动,所述移动机器人的实际物理模型如下:其中,v表示移动机器人的线速度,θ表示移动机器人的位姿角,u
r
和u
l
分别表示右轮和左轮的驱动控制输入,c表示黏性摩擦系数,k表示驱动增益,M1表示移动机器人的质量,I
w
表示车轮的转动惯量,I
v
表示绕机器人重心的转动惯量,r表示车轮半径,l表示左右轮到机器人重心的距离;第二步、构建所述双后轮独立驱动刚性移动机器人控制系统的离散状态空间方程:将所述移动机器人的线速度、位姿角和位姿角导数定义为状态变量:定义输入变量为驱动控制输入:u=[u
r u
l
]
T
,输出变量为所述移动机器人的线速度和位姿角:y=[v θ]
T
,则式(1)所示的移动机器人控制系统描述为:其中,对连续系统模型式(2)进行离散化,选取满足香农采样定理的采样周期T
s
,进一步得到所述移动机器人控制系统的离散状态空间模型:式中t和k分别代表采样时间和批次,批次过程的运行周期为T,且在每个重复过程周期t∈[0,T]内,取N
d
个采样点;u
k
(t)∈R
l
,y
k
(t)∈R
m
和x
k
(t)∈R
n
分别是所述移动机器人控制
系统第k批次t时刻的l维输入、m维输出和n个状态向量;A,B,C为式(2)对应的离散系统参数矩阵,且满足CB≠0;并且假设系统运行的初始状态在围绕期望初始状态x
d
(0)的小范围内随机变化,其数学期望满足E{x
k
(0)}=x
d
(0);第三步、利用随机变量建立批次长度随机变化模型:针对式(3)形式的线性离散系统,将其状态空间表达式转换为时间序列的输入输出矩阵模型:y
k
=Gu
k
+d
k
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中:其中:u
k
=[u
k
(0),u
k
(1),...,u
k
(N
d-1)]
T
y
k
=[y
k
(1),y
k
(2),...,y
k
(N
d
)]
T
G是时间序列上的输入输出传递矩阵,d
k
是系统初始状态对输出的影响;输入Hilbert空间和输出Hilbert空间分别由如下内积及相关的诱导范数定义:分别由如下内积及相关的诱导范数定义:其中,分别为输入输出Hilbert空间上的向量,权矩阵R和Q为适当维数的实正定矩阵;并且,定义期望输出y
d
∈l2[0,N
d
]为:y
d
=[y
d
(1) y
d
(2)

y
d
(N
d
)]
T
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)传统的迭代学习控制要求批次长度固定为预期长度N
d
,然而实际的运行批次长度在不同批次之间可能随机变化;记第k次迭代实际批次长度为N
k
,定义实际批次长度的最小值与最大值分别为N
m
和N
h
;实际情况下一般将预期长度N
d
设定为最大长度,即N
d
=N
h
;那么实际批次长度N
k
在{N
m
,N
m
+1,

,N
d
}内随机变动,即至多存在τ
m
=N
d-N
m
+1个运行批次长度;为了描述批次长度的随机性,令批次长度为N
m
,N
m
+1,

,N
d
的概率分别为其中p
i
>0,1≤i≤τ
m
,且当实际批次长度N
k
小于预期长度N
d
时,第k批次的输出y
k
在时刻t∈[N
k
+1,N
d
]是缺失的,不能被用于输入的更新;将缺失时刻的跟踪误差简单地设置为零,从而转化成常规情况;那么得到修正后的跟踪误差为:
修正后的跟踪误差序列为:当N
k
<N
d
时,e
k
≠y
d-y
k
,于是引入如下随机矩阵M
k
来消除该不等关系:其中表示N
k
×
N
k
维的单位矩阵、I
m
表示m
×
m维的单位矩阵、表示(N
d-N
k
)
×
(N
d-N
k
)维的零矩阵,表示克罗内克积,于是修正后的跟踪误差序列表示为:对于多输出系统,当其中一个输出出现提前终止的情况,其它的输出也应同时终止,即使其它输出并未终止,其产生的输出也失去了学习的价值;例如,所述移动机器人在预设轨迹上移动时,遇到障碍提前停止,所述线速度变为零,但所述位姿角仍在变化,然而位姿角之后的输出值失去了迭代学习的价值,因此在刻画多输出系统随机矩阵的数学期望时,可以看做各输出具有相同的数学期望;为了计算所述随机矩阵M
k
的数学期望,引入伯努利二元随机变量γ
k
(t)来表示第k批次时刻t输出是否存在;记第k批次时刻t输出存在的概率为p(t),则有:由于E{γ
k
(t)}=P{γ
k
(t)=1}
×
1+P{γ
k
(t)=0}
×
0=p(t),则所述随机矩阵M
k
的数学期望计算如下:其中,用来简单表示随机矩阵的期望;第四步、设计批次长度可变的迭代学习轨迹跟踪优化算法:将批次长度随机变化的离散状态空间模型(3)作为批次长度随机变化系统,给定任意初始输入及对应的跟踪误差,通过如下定义的输入信号:得到的输入序列{u
k
}
k≥0
能够迭代地解决批次长度随机变化下的跟踪问题,其中,M为某一批次的随机矩阵,其定义与式(10)相同,输入信号控制律的前馈形式通过求解如下定义的第一性能指标函数得到:
将式(11)和式(4)先后代入所述第一性能指标函数(15),求其...

【专利技术属性】
技术研发人员:陶洪峰庄志和黄彦德官上雷胡计昶陶新悦
申请(专利权)人:江南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1