System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种非线性摆系统的预测控制模型方法及系统技术方案_技高网

一种非线性摆系统的预测控制模型方法及系统技术方案

技术编号:45097404 阅读:3 留言:0更新日期:2025-04-25 18:35
本发明专利技术涉及一种非线性摆系统的预测控制模型方法及系统,主要包括以下步骤:根据非线性摆系统的工作状态,构建非线性摆系统的动力学模型;结合迟滞量化器对控制输入进行量化,缓解了网络资源受限对非线性摆系统协同性能的限制;设计一种可在线学习的学习型模型预测控制算法,在线预测最优控制增益矩阵,有效减小通信缺陷对系统性能的影响;构建了与Markov切换拓扑相关的Lyapunov函数,将其作为学习型模型预测控制算法的代价函数。本发明专利技术可以进一步降低非线性摆系统的传输效率,通过神经网络的实时自适应调整,学习型模型预测控制算法有效地实现了代价函数的最小化,优化了反馈控制矩阵。

【技术实现步骤摘要】

本专利技术属于非线性摆系统控制领域,具体涉及一种非线性摆系统的预测控制模型方法及系统


技术介绍

1、倒立摆是一个开环不稳定的强非线性系统,其控制策略与杂技运动员顶杆平衡表演的技巧有异曲同工之处,目的在于使得摆杆处于临界稳定状态,是进行控制理论研究的典型实验平台。20世纪50年代,麻省理工学院的控制论专家根据火箭助推器原理设计出了第一套倒立摆实验设备,开启了最初的相关研究工作。倒立摆系统作为经典的非线性控制系统,因其自身的不稳定性和对控制算法的高要求,成为验证各种控制策略有效性的理想平台。

2、一级倒立摆系统由一根垂直放置的杆子以及一个可以水平移动的小车构成。小车的水平位移和杆子的角度共同描述了系统的状态。控制目标是通过控制小车的水平加速度,使倒立摆保持直立平衡状态,无论初始状态如何。与仅考虑角度的简化模型不同,本文考虑了小车与平衡点的距离信息,这更贴近实际应用场景,也增加了控制的复杂度。倒立摆系统是一个典型的非线性、强耦合、多变量和不稳定系统,倒立摆系统的稳定控制是控制理论中的典型问题,同时也是学习各种控制理论的经典案例。


技术实现思路

1、以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

2、为了解决上述技术问题,本专利技术涉及一种非线性摆系统的预测控制模型方法及系统,以进一步提升控制器的鲁棒性和性能。

3、第一方面,一种非线性摆系统的预测控制模型方法,其特征在于,包括以下步骤:

4、步骤s1:根据非线性摆系统的工作状态,构建非线性摆系统的动力学模型;

5、步骤s2:结合迟滞量化器对控制输入进行量化,缓解了网络资源受限对非线性摆系统协同性能的限制;

6、步骤s3:根据所述步骤s1和s2,设计一种可在线学习的学习型模型预测控制算法,在线预测最优控制增益矩阵,有效减小通信缺陷对系统性能的影响;

7、步骤s4:根据步骤s3,构建了与markov切换拓扑相关的lyapunov函数,将其作为学习型模型预测控制算法的代价函数。

8、1.根据权利要求1所述的一种非线性摆系统的预测控制模型方法,其特征在于,包括以下步骤:

9、步骤s1:根据非线性摆系统的工作状态,构建非线性摆系统的动力学模型;

10、所述非线性摆系统的动力学模型为:

11、

12、其中,x和v分别代表非线性摆的位移和速度,u表示控制输入;

13、设ζi(t)=[xi(t),vi(t)]t,所述连续时间的状态空间方程为:

14、

15、其中,a和b均表示非线性摆系数矩阵;

16、上述所述的是连续的非线性摆系统,本专利技术进一步提出了离散时间下基于非线性摆系统模型:

17、xi(k+1)=f(xi(k),ui(k))

18、2.根据权利要求1所述的一种非线性摆系统的预测控制模型方法,其特征在于,包括以下步骤:

19、步骤s2:结合迟滞量化器对控制输入进行量化,缓解了网络资源受限对非线性摆系统协同性能的限制;

20、由于迟滞型量化器能有效减少振荡现象,并确保量化值在切换过程中更加平稳,所以本文考虑离散化的迟滞量化器:

21、

22、式中,ρ=(1-δ)/(1+δ),(0<ρ<1)参数决定量化密度,uj=ρ1-ju0(j=1,…,nx)。

23、为了优化多智能体间的网络资源,本文提出了一种量化反馈控制器:

24、

25、式中,kk为控制器增益矩阵。

26、为了便于进一步讨论,叠加单个控制信号得到控制输入向量u(k)=[u1(k)…un(k)]t。同理x(k)=[x1(k)…xn(k)]t。结合上式,控制输入可重新表述成如下向量形式:

27、

28、令p=θ(k),则mass的系统状态向量可描述为:

29、

30、其中,fpi(x(k))表示函数f(xi(k),ui(k)),且满足假设1。

31、3.根据权利要求1所述的一种非线性摆系统的预测控制模型方法,其特征在于,包括以下步骤:

32、步骤s3:根据所述步骤s1和s2,设计一种可在线学习的学习型模型预测控制算法,在线预测最优控制增益矩阵,有效减小通信缺陷对系统性能的影响;

33、代价函数定义为:

34、

35、式中,pp,p∈s为与markov模态相关的正定矩阵。

36、lmpc的目标是找到使代价成本j(e(k))最小的j。则最优的反馈增益矩阵满足以下条件:

37、

38、本专利技术旨在使用浅层神经网络解决优化问题(17)。在本文中,浅层神经网络输入层由长度为l(l=nxnu)的序列构成,其中a∈{1...nx}和b∈{1…nu}。为了训练得到最优的增益值kk,选择了一个具有m个神经元的单层隐藏层。输入层由代价函数j(e(k))的值组成。

39、令隐藏层产生的信号由下式给出:

40、w=σ(wz)

41、式中,σ表示sigmoid函数。w∈rm×(l+1)表示神经元的权重矩阵。对于给定的增益kk,成本函数的输出层j可近似为:

42、

43、其中,y∈r1×m表示输出层的权重矩阵。神经网络在迭代学习的过程中不断优化权重w和y,以便更好地拟合出控制增益。

44、模型预测控制算法具体步骤如下:初始阶段,系统给定初始条件x(0)、初始模态θ(0)和代价函数j0。为了方便起见,初始增益矩阵k0设为空值。随后与j0一同作为神经网络的初始训练数据集。然后,神经网络通过迭代学习来预测代价函数的值在每次迭代中,前面的kk会提供不同的组合以生成代价函数的预测值为了提高预测的精确度,对于不同中的kk可通过±δ调节。之后,选择预测值最小的一项作为最优的控制增益kk,据此确定控制输入u(k)。接下来,为了更准确地估计的值,算法引入了lmpc协议的循坏预测机制。具体步骤为:1)根据前一时刻和概率转移矩阵π自动生成跳变模式θ(t);2)计算预测的控制输入和系统状态3)估算近似值在每次迭代结束后,求和当前所有的得到成本函数的近似值最后,将得到的预测值及对应的最优增益存储在数据集中,以供下一步迭代。重复上述步骤,直至预测值达到预设的最小条件ξ。由此可认为优化问题已得到解决,结束训练。

45、4.根据权利要求1所述的一种非线性摆系统的预测控制模型方法,其特征在于,包括以下步骤:

46、步骤s4:构建了与markov切换拓扑相关的lyapunov函数,将其作为学习型模型预测控制算法的代价函数。

47、第二方面,本专利技术实施例还提供了一种非线性摆系统的预测控制模型系统,包括:s001非线性倒立摆模型、s002离散时间非线性倒立摆系统、s003传感器、s004迟滞量化策略、s005控制器、s本文档来自技高网...

【技术保护点】

1.一种非线性摆系统的预测控制模型方法及系统,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种非线性摆系统的预测控制模型方法,其特征在于,包括以下步骤:

3.根据权利要求1所述的一种非线性摆系统的预测控制模型方法,其特征在于,包括以下步骤:

4.根据权利要求1所述的一种非线性摆系统的预测控制模型方法,其特征在于,包括以下步骤:

5.根据权利要求1所述的一种非线性摆系统的预测控制模型方法,其特征在于,包括以下步骤:

【技术特征摘要】

1.一种非线性摆系统的预测控制模型方法及系统,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种非线性摆系统的预测控制模型方法,其特征在于,包括以下步骤:

3.根据权利要求1所述的一种非线性摆系统的预测控制...

【专利技术属性】
技术研发人员:卢毅伍锡如张本鑫刘培宇刘金霞
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1