【技术实现步骤摘要】
一种改进的反步法控制器及参数整定方法
[0001]本专利技术涉及一种针对不确定性非线性系统的反步法控制器设计方法,适应于高阶非线性系统的运动控制,以及大时滞系统的过程控制,如:无人飞行器姿态控制、化工反应器、供暖系统温度控制等。
技术介绍
[0002]反步法控制是高阶系统跟踪控制的有效方法,随着系统阶数的增大,反步法控制器的设计需要对虚拟控制信号反复求导,这导致了微分爆炸问题的出现。不确定性非线性系统的反步法控制需要对其非线性函数和不确定函数进行逼近,利用神经网络或者模糊逻辑系统的逼近方法比较多,但是其结构复杂,不利于工程实现。扩张状态观测器应用于自抗扰控制器的设计,将系统中外扰、非线性函数和不确定函数视为总扰动,并对其进行观测。线性扩张状态观测器结构简单,在自抗扰控制器设计中得到了广泛的应用。将反步法控制器与扩张状态观测器的结合存在大量的参数,且难以通过人工整定获得良好的控制效果。大量的实验和文献表明,公式法整定得到的参数也并非是最优效果。参数整定是目前阻碍反步法与扩张状态观测器结合应用的一大难题。
技术实现思路
< ...
【技术保护点】
【技术特征摘要】
1.一种改进的反步法控制器及参数整定方法,其特征在于,包括下列步骤:(1)控制器的控制对象为不确定性非线性高阶串联微分型系统;(2)控制器由非线性跟踪微分器、反步法增益放大器、连续动作强化学习器和扩张状态观测器组成;(3)反步法增益放大电路的放大倍数,扩张状态观测器的增益,被控对象的控制增益估计值,由连续动作强化学习器通过优化算法得出最优值;(4)根据系统跟踪误差及超调量计算适应度函数值;(5)连续动作强化学习器根据适应度函数在线整定控制器参数;(6)连续动作强化学习器存在有效可行区间,当扩张状态观测器的观测值超出有效可行区间时,控制对象终止运行,并为目标函数赋一个较大的正实数;(7)连续动作强化学习器返回整定结果至控制器。2.根据权利要求1所述的不确定性非线性高阶串联微分型系统,其表达式为其中,为状态变量,为系统输入量,为系统输出量,是系统未知光滑非线性函数,系统参数。3.根据权利要求1所述的非线性跟踪微分器,其特征在于,表达式为其中,表示该滤波器将应用于反步法控制的第步的滤波,为反馈增益,且均为正常数,为滤波器的滤波误差,为滤波器的输出信号,为滤波器的输入信号,为非线性函数,表达式为:。4.根据权利要求1所述的反步法增益放大器,其特征在于,表达式为Step 1:<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。