一种切换线性系统的数据驱动最优控制方法技术方案

技术编号:19963054 阅读:35 留言:0更新日期:2019-01-03 12:14
本发明专利技术公开了一种切换线性系统的数据驱动最优控制方法,能够在具体的子系统模型未知的情况下,只根据可测的系统状态量对切换线性系统进行最优切换时间的结算,从而有效实现切换线性系统的最优切换控制。该方法包括如下步骤:利用采样数据根据时变矩阵的递推式从终端时刻倒推各时刻的时变矩阵;在已估计出的时变矩阵的基础上利用采样数据根据系统状态和时变矩阵之间的相互关系推导代价函数偏导的估计;将已估计出的代价函数偏导应用于梯度下降算法实现切换时间的更新;根据计算的最优切换时间对切换线性系统进行切换控制。

A Data-Driven Optimal Control Method for Switched Linear Systems

The invention discloses a data-driven optimal control method for switched linear systems, which can settle the optimal switching time of switched linear systems only according to the measurable system state variables when the specific subsystem model is unknown, thus effectively realizing the optimal switching control of switched linear systems. The method includes the following steps: using the sampled data to deduce the time-varying matrix from the terminal time according to the recursive formula of the time-varying matrix; using the sampled data to deduce the estimation of the cost function partial derivatives based on the relationship between the system state and the time-varying matrix; applying the estimated cost function partial derivatives to the gradient descent algorithm to achieve tangent The switching time is updated, and the switching control of switched linear systems is carried out according to the optimal switching time calculated.

【技术实现步骤摘要】
一种切换线性系统的数据驱动最优控制方法
本专利技术涉及切换控制系统
,具体涉及一种切换线性系统的数据驱动最优控制方法。
技术介绍
在切换系统控制中,由于不确定性因素的存在,子系统模型可能会发生改变,可能难以获得子系统模型或者精确的子系统模型,此时传统的基于模型的方法已经不能解决问题或者难以保证良好的性能。因此,如果在控制过程中不能准确得到系统模型,就需要研究一种不依赖于系统模型的控制算法。
技术实现思路
有鉴于此,本专利技术提供了一种切换线性系统的数据驱动最优控制方法,能够在具体的子系统模型未知的情况下,只根据可测的系统状态量对切换线性系统进行最优切换时间的结算,从而有效实现切换线性系统的最优切换控制。为达到上述目的,本专利技术的技术方案为:一种切换线性系统的数据驱动最优控制方法,所针对的切换线性系统的状态方程为其中为系统状态x(t)的导数,x(t)∈Rn为系统状态,x(t)状态量可测,Rn是指n维实数空间,即x(t)具有n个状态分量x(t)=[x1(t),x2(t),...,xn(t)]T;Ai∈Rn×n是未知的子系统矩阵,Rn×n为n×n维实数空间;i∈{0,1,2,...,N本文档来自技高网...

【技术保护点】
1.一种切换线性系统的数据驱动最优控制方法,其特征在于,所述切换线性系统的状态方程为

【技术特征摘要】
1.一种切换线性系统的数据驱动最优控制方法,其特征在于,所述切换线性系统的状态方程为其中为系统状态x(t)的导数,x(t)∈Rn为系统状态,x(t)状态量可测,Rn是指n维实数空间,即x(t)具有n个状态x(t)=[x1(t),x2(t),...,xn(t)]TAi∈Rn×n是未知的子系统矩阵,Rn×n为n×n维实数空间;i∈{0,1,2,...,N}是所述切换线性系统设定的子系统切换顺序索引,N是切换次数;ti是切换时间,即为所述切换线性系统的控制量,满足t0<t1<…<tN-1<tN<tN+1=tf;其中t0=0是初始时间,tf是终端时间;所述切换线性系统的有限时间代价函数为:其中Qf为终端加权矩阵,Qf为给定的正定对阵矩阵,满足Q是指给定的加权矩阵,根据实际需要进行设定,Q为给定的正定对阵矩阵,满足Q=QT≥0;在优化过程中,对于任意x(t)∈Rn和t∈[t0,tf),所述切换线性系统从时刻t的状态x(t)开始,其代价函数为:xT(t)为x(t)的转置;P(t)为时变矩阵,P(t)为对称的并且满足如下条件:为P(t)的导数;针对所述切换线性系统,采用如下步骤进行最优切换时间控制:步骤1、针对所述时变矩阵P(t):其中δt为时间间隔,取值在(0,0.1)之间;将式(5)两端均左乘x(t′)T并右乘x(t′)得到:其中t′是一个与时刻t无关的时刻;根据积分中值定理,得到:其中θ1为[0,1]之间的常数;x(t′+δt)-x(t′)=Aix(t′+θ2δt)·δt,0≤θ2≤1,t′,t′+δt∈[ti,ti+1)(8)其中θ2为[0,1]之间的常数;将(7)和(8)代入(6)可得:x(t′)TP(t+δt)x(t′)-x(t′)TP(t)x(t′)=-2x(t′)TP(t)(x(t′+δt)-x(t′))-x(t′)TQx(t′)·δt+er1(t,t′)+er2(t,t′)其中t∈[ti,ti+1),t′∈[ti,ti+1);er1(t,t′)为关于t′时刻和t时刻的第一误差;er1((t,t′)=-2x(t′)T(P(t+θ1δt)-P(t))Aix(t′)·δt;er2(t,t′)为关于t′时刻和t时刻的第二误差;er2(t,t′)=2x(t′)TP(t)Ai(x(t′+θ2δt)-x(t′))·δt;得到P(t)和P(t+δt)之间的关系式如下:3x(t′)TP(t)x(t′)-2x(t′)TP(t)x(t′+δt)=x(t′)TP(t+δt)x(t′)+x(t′)TQx(t′)·δt-er1(t,t′)-er2(t,t′)(9)式(9)中第一误差er1(t,t′)和第二误差er2(t,t′)忽略不计,得到如下估计:其中为时变矩阵P(t)的估计值;引入克罗内克Kronecker积表示(10):其中cs(*)是矩阵*的列展开;建立如下状态参数矩阵:包括第一状态参数矩阵Ci、第二状态参数矩阵Di、第三状态参数矩阵Ei、第四状态参数矩阵Er1(t)以及第五状态参数矩阵Er2(t);i=0,1,2,...N;其中x(t′i1)~x(t′il)分别为t′i1~t′il时刻的系统状态,t...

【专利技术属性】
技术研发人员:甘明刚张弛陈杰窦丽华张蒙赵金刚白永强
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1