一种倒立摆自适应迭代学习反演控制方法技术

技术编号：21890338 阅读：23 留言：0更新日期：2019-08-17 13:55

一种倒立摆自适应迭代学习反演控制方法,针对含有未知输入饱和的倒立摆系统，利用神经网络和反演控制方法，结合自适应迭代学习控制，设计一种自适应迭代学习反演控制器。积分李雅普诺夫函数的构建解决了由于未知增益函数求导引起的控制问题。基于中值定理，采用双曲正切函数逼近输入饱和项。然后，采用径向基神经网络逼近和补偿系统不确定未知项，并采用两个组合自适应律更新神经网络的权值和估计误差的界。本发明专利技术在系统存在输入饱和的情况下，提供了一种能补偿系统未知不确定性，解决由于未知增益函数求导引起的控制问题，实现系统跟踪误差在有限迭代次数内二范数收敛到零附近的控制方法。

An adaptive iterative learning inversion control method for inverted pendulum

全部详细技术资料下载

【技术实现步骤摘要】
一种倒立摆自适应迭代学习反演控制方法
本专利技术涉及一种倒立摆自适应迭代学习反演控制方法，特别是带有未知输入饱和的倒立摆控制方法。
技术介绍
倒立摆系统的控制问题就是控制摆杆快速达到一个平衡位置，使其没有明显的振荡和过大的角度和速度。倒立摆系统具有自然不稳定性，强耦合，强非线性，存在外界干扰等特点，对倒立摆系统的研究可以有效反映非线性控制的典型问题，如非线性问题，鲁棒性问题等。因此研究存在输入饱和的情况下倒立摆系统的控制问题具有十分重要的意义。迭代学习控制方法是一种具有强学习能力的控制方法，尤其是在解决重复作业的控制问题上展现了它的优越性。基于李雅普诺夫函数的自适应迭代学习控制充分利用上一次迭代后的系统信息，对系统的不确定参数和控制器中未知控制增益进行自适应迭代学习，不断提高系统的跟踪性能。针对系统参数或是结构存在非线性不确定性的情况下，自适应迭代学习控制能有效保证系统的稳定性，在有限时间区间内达到很高的跟踪精度。当系统模型不确定甚至是未知时，自适应迭代学习控制方法也可以达到完美的跟踪效果。神经网络可以在任意精度内逼近一个未知函数，补偿不确定项，能有效地处理系统模型不确定性，参数不确定性等问题，因此被广泛用于解决系统动态模型中存在的不确定性。而径向基神经网络结构具有三层前馈网络，结构简单，收敛快速，不仅优化了算法的学习速度又避免了局部极小问题。在研究非线性系统控制问题时，大多数的增益函数都是未知的，在李雅普诺夫稳定性分析中会有可能会出现由于对系统未知增益函数的求导而引起的奇异值问题等控制问题，因此构造一个简单有效的李雅普诺夫函数十分重要。因此，研究在存在输...

【技术保护点】
1.一种倒立摆自适应迭代学习反演控制方法，其特征在于，所述控制方法包括以下步骤：步骤1，建立倒立摆的动态模型，初始化系统状态、采样时间以及控制参数，过程如下：1.1 倒立摆的动态模型表达形式为：

【技术特征摘要】
1.一种倒立摆自适应迭代学习反演控制方法，其特征在于，所述控制方法包括以下步骤：步骤1，建立倒立摆的动态模型，初始化系统状态、采样时间以及控制参数，过程如下：1.1倒立摆的动态模型表达形式为：其中x1,k，x2,k分别是角度位置和角速度，k是迭代次数；分别是角度位置和角速度的一阶导数；g是重力加速度；mc，m是分别是小车和倒立摆的质量；l是倒立摆长度的一半；uk表示控制输入，sat(uk)表示受饱和限制的控制输入，其表达形式为：其中um是uk的最大值，|uk|表示uk的绝对值，sgn(uk)表示uk的符号函数；1.2定义未知函数f(xk)和b(xk)，将式(1)写成以下形式：其中是未知的光滑函数；xk＝[x1,k,x2,k]T；从b(xk)的表达式中得到b(xk)＞0；步骤2，逼近和估计输入饱和项，其过程如下：采用以下的双曲正切函数逼近输入饱和函数：其中tanh(·)表示双曲正切函数；由此得sat(uk)＝g(uk)+d(uk)(5)其中d(uk)是一个有界函数，满足|d(uk)|＝|sat(uk)-g(uk)|≤um(1-tanh(1))＝D(6)其中D是一个未知正数，|d(uk)|表示d(uk)的绝对值；通过微分中值定理计算，得出其中uξ＝ξuk+(1-ξ)u0，u0∈[0,uk]；0＜ξ＜1是一个常数；是uk＝uξ时对g(uk)的偏导，取u0＝0，g(u0)＝0；则公式(7)写为：将公式(8)代入到公式(5)中，得步骤3，计算系统跟踪误差，其过程如下：定义系统跟踪误差z1,k如下：z1,k＝x1,k-xd(10)其中xd是给定的光滑有界的参考轨迹；对公式(10)求导得到：其中是系统跟踪误差的一阶导数，是参考轨迹的一阶导数；步骤4，定义误差变量，设计虚拟控制器，其过程如下：4.1定义误差变量z2,k为：z2,k＝x2,k-α1,k(12)其中，α1,k是设计控制器过程中的虚拟控制器；系统初始条件为：z1,k(0)＝0，z2,k(0)＝0；对式(12)进行求导，得到：其中是误差变量的一阶导数，是设计控制器过程中虚拟控制器的一阶导数；将式(3)，式(9)代入式(11)和式(13)中，得到：由此，计算：其中由于0＜guξ≤1，则必定存在一个正的常数gN使得成立；然后，得出是有界的，并且其中表示的绝对值，ρD是一个大于零的常数；4.2为逼近函数设计以下神经网络：定义W*为神经网络理想权重矩阵，则写成以下形式：...

【专利技术属性】
技术研发人员：陈强，施卉辉，陈凯杰，孙明轩，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人