当前位置: 首页 > 专利查询>江南大学专利>正文

一种高阶无模型自适应迭代学习控制方法技术

技术编号:37251186 阅读:8 留言:0更新日期:2023-04-20 23:29
本发明专利技术公开了一种高阶无模型自适应迭代学习控制方法,属于工业过程控制领域。所述方法利用输入输出数据,旨在对具有往复运动的非线性被控对象进行直接控制,避免了建立精确的数学模型。首先实时采集被控制系统的输入输出数据建立起一个包含伪时变的偏导数的动态线性化模型。由于被控系统输出误差收敛的速度与为偏导数初值选取有关,因此采用高阶算法对伪偏导数进行估计继而消除伪偏导数初值设置的影响,然后根据估计的伪偏导数值重新设计控制器,随着迭代次数的增加,系统输出误差逐渐减小并快速跟踪期望轨迹。该方法计算量小,调节参数少,控制精度高且具有较强误差收敛性。控制精度高且具有较强误差收敛性。控制精度高且具有较强误差收敛性。

【技术实现步骤摘要】
一种高阶无模型自适应迭代学习控制方法


[0001]本专利技术涉及一种高阶无模型自适应迭代学习控制方法,属于工业过程控制领域。

技术介绍

[0002]在实际工业控制过程中,有很多被控对象都是在固定时间段内执行重复运动的控制任务,例如用于装运,喷涂等方面的机器人以及工业过程中的批处理过程等。实际上,这种重复运动行为也可被用于提高控制性能。然而传统控制方法,如PID控制、自适应控制等大多基于模型控制并且不具备从过去重复过程中学习的能力,与此同时实际控制过程中往往存在非线性、不确定性、时变等因素,因而一般无法获得被控对象精确的数学模型,传统基于模型的控制方法显得力不从心。
[0003]迭代学习控制(Iterative Learning Control,ILC)是由日本学者M.Uchiyama提出,主要用于解决非线性对象的模型与参数未知情况下的轨迹跟踪问题(参见Uchiyama M.Formulation of high

speed motion pattern of a mechanical arm by trial.Control Engineering,1984,14(6):706

712.),在多次重复运动情况下根据误差不断修正控制变量从而提高控制精度。无模型自适应控制(Model Free Adaptive Control,MFAC)由侯忠生于1994年提出,其核心思想是根据输入输出数据实时建立一个包含时变参数伪偏导数的线性模型进而设计控制器(参见侯忠生.非线性系统参数辨识、自适应控制和无模型学习自适应控制.沈阳:东北大学博士学位论文,1994.),此方法无需建立精确数学模型。针对一大类具有重复运行性质的非线性非仿射系统控制问题,无模型自适应迭代学习控制方法(Model Free Adaptive Iterative Learning Control,MFAILC)应运而生,与ILC采用的固定增益相比,MFAILC的增益是时变的,对复杂被控对象更具有适应性与稳定性。
[0004]在迭代学习控制中,误差收敛的快慢是一个很重要的性能指标,对于无模型自适应控制而言也是如此。经过实验证明误差收敛速度与伪偏导数初值的选取有关,往往需要多次选取初值来寻找最优值,因而MFAILC中伪偏导数估计算法并不能保证误差的快速收敛性。

技术实现思路

[0005]为了提升无模型自适应控制系统的误差收敛速度,提升控制准确率,本专利技术提供了一种高阶无模型自适应迭代学习控制方法,所述技术方案如下:
[0006]步骤1:首先确定需要学习迭代的次数n,设置伪偏导数φ0(t)初值,然后实时采集系统多次运行后的输入输出数据,分别构建历史输入输出数据库,将数据保存为数据向量形式:y
k
(t+1),u
k
(t+1),其中k表示迭代次数也即是被控对象运行次数;
[0007]步骤2:根据实时采集的输入输出数据建立动态线性化模型;
[0008]步骤3:辨识步骤2中建立的动态线性化模型中的伪偏导数;
[0009]步骤4:根据步骤3计算得到的伪偏导数估计值重新设计控制器,即调节控制
增益实现对系统的控制;
[0010]步骤5:采集控制后的系统输入输出数据并计算每次迭代运行中各个时刻的误差e
k
(t+1);
[0011]步骤6:重复步骤3到步骤5操作,直至系统输出最大误差收敛值接近于0。
[0012]可选的,所述步骤2中建立的动态线性化模型为:
[0013]Δy
k
(t+1)=φ
k
(t)Δu
k
(t)
[0014]Δy
k
(t+1)=y
k
(t+1)

y
k
‑1(t+1)
[0015]Δu
k
(t)=u
k
(t)

u
k
‑1(t)
[0016]其中,φ
k
(t)为伪偏导数,Δu
k
(t),Δy
k
(t+1)分别表示系统相邻批次下运行的输入输出变化量,t表示时刻。
[0017]可选的,所述步骤3根据参数估计准则函数确定所述伪偏导数估计值的更新方法,过程包括:
[0018]当系统运行次数小于学习次数即k<n时,定义如下准则函数:
[0019][0020]其中,
μ
为权重因子,为φ
k
(t)的估计值;
[0021]对φ
k
(t)求导,得到伪偏导数估计值计算方法:
[0022][0023]其中,η
k
表示步长序列;
[0024]当或|Δu
k
(t)|≤ε或时:
[0025][0026]其中,ε为一个极小的正数;
[0027]当系统运行次数大于学习次数,即k>n时,定义如下参数估计准则函数:
[0028][0029]对上式求取关于φ
k
(t)偏导数,得到伪偏导数估计值的高阶估计计算方法:
[0030][0031]当或|Δu
k
(t)|≤ε或时:
[0032][0033]其中,ε为一个极小的正数。
[0034]可选的,所述步骤4包括:
[0035]确定控制律设计目标函数,将所估计的伪偏导数值代入进而重新设计控制器,定义如下控制目标函数:
[0036]J(u
k
(t))=|y
r
(t+1)

y
k
(t+1)|2+λ|u
k
(t)

u
k
‑1(t)|2+γ|e
k
‑1(t+1)

e
k
‑2(t+1)|
2 (16)
[0037]其中,λ≥0为权重因子,用来限制相邻迭代次数下控制输入变化量的变化,γ≥0用于限制相邻迭代次数下跟踪误差的变化;
[0038]根据优化条件得到:
[0039][0040]可选的,所述步骤5包括:计算系统每次迭代下各个时刻实际输出值与期望值误差:
[0041]e
k
(t+1)=y
k
(t+1)

y
r
(t+1) (18)
[0042]其中y
k
(t+1)表示在第k次迭代下系统实际输出值,y
r
(t+1)表示期望值。
[0043]可选的,所述被控对象的非线性非仿射数学模型为:
[0044][0045]其中α(t)=1+round(t/50)是一个时变参数,其中y(t)和u(t)分别是所述被控对象t时刻的输出和输入。
[0046]可选的,所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自适应迭代学习控制方法,其特征在于,所述方法包括:步骤1:首先确定需要学习迭代的次数n,设置伪偏导数φ0(t)初值,然后实时采集系统多次运行后的输入输出数据,分别构建历史输入输出数据库,将数据保存为数据向量形式:y
k
(t+1),u
k
(t+1),其中k表示迭代次数也即是被控对象运行次数;步骤2:根据实时采集的输入输出数据建立动态线性化模型;步骤3:辨识步骤2中建立的动态线性化模型中的伪偏导数;步骤4:根据步骤3计算得到的伪偏导数估计值重新设计控制器,即调节控制增益实现对系统的控制;步骤5:采集控制后的系统输入输出数据并计算每次迭代运行中各个时刻的误差e
k
(t+1);步骤6:重复步骤3到步骤5操作,直至系统输出最大误差收敛值接近于0。2.根据权利要求1所述的方法,其特征在于,所述步骤2中建立的动态线性化模型为:Δy
k
(t+1)=φ
k
(t)Δu
k
(t)Δy
k
(t+1)=y
k
(t+1)

y
k
‑1(t+1)Δu
k
(t)=u
k
(t)

u
k
‑1(t)其中,φ
k
(t)为伪偏导数,Δu
k
(t),Δy
k
(t+1)分别表示系统相邻批次下运行的输入输出变化量,t表示时刻。3.根据权利要求2所述的自适应迭代学习控制方法,其特征在于,所述步骤3根据参数估计准则函数确定所述伪偏导数估计值的更新方法,过程包括:当系统运行次数小于学习次数即k<n时,定义如下准则函数:其中,μ为权重因子,为φ
k
(t)的估计值;对φ
k
(t)求导,得到伪偏导数估计值计算方法:其中,η
k
表示步长序列;当或|Δu
k
(t)|≤ε或时:其中,ε为一个极小的正数;当系统运行次数大于学习次数,即k>n时,定义如下参数估计准则...

【专利技术属性】
技术研发人员:王志国高方青倪雨青栾小丽刘飞
申请(专利权)人:江南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1