【技术实现步骤摘要】
一种基于数据驱动的LPV系统的LQG控制器的设计方法
本专利技术属于大规模线性动态系统控制器设计领域,具体涉及为基于数据驱动的参数时变切换系统的降阶控制器设计。
技术介绍
大规模动态切换系统往往对某些控制参数具有高度敏感性,控制系统的性能很大程度上取决于系统应对这些参数突变的反应速度,在保证系统灵敏度的情况下,保证系统的稳定性。因此对这一类线性变参数系统(LinearParameter-Varyingsystem,即LPV系统),选取合适的控制方法去满足依赖于特定时变切换参数的控制器是至关重要的。基于模型的反馈控制为控制器的设计提供了一种优雅和数学上合理的方法。基于数据驱动的反馈增益控制是一种数学合理且具有极强实操性的设计方法。常规LPV系统的闭环反馈增益控制大多基于无噪声的假设,并通过求解Riccati方程得到反馈增益,这种方法是不现实的,原因在于实际控制过程中,系统或多或少会存在测量噪声,而线性二次高斯控制器可以在轻微假设下,有效地提高控制器的性能。大规模动态系统往往阶数庞大,计算极为不便,低算力情况下会 ...
【技术保护点】
1.一种基于数据驱动的LPV系统的LQG控制器的设计方法,其特征在于,包括:/nS1,建立系统方程,对不同参数情况下的传感器输入进行等时间间隔采样,并利用POD方法对其进行降阶,获得降阶基;/nS2,在不同参数情况下,分别计算系统滤波代数Riccati方程与控制器代数Riccati方程,求得滤波器增益和控制器增益;/nS3,建立数据库,将所有先验参数的降阶基和S2求得的两种增益一一对应,保存在数据库中,其中降阶基作为机器学习分类器的学习基,选择合适的机器学习模型,以数据库中学习基为训练集,对应的两种增益参数为标签,设计分类器模型,该分类器模型即为LQG控制器。/n
【技术特征摘要】 【专利技术属性】
1.一种基于数据驱动的LPV系统的LQG控制器的设计方法,其特征在于,包括:
S1,建立系统方程,对不同参数情况下的传感器输入进行等时间间隔采样,并利用POD方法对其进行降阶,获得降阶基;
S2,在不同参数情况下,分别计算系统滤波代数Riccati方程与控制器代数Riccati方程,求得滤波器增益和控制器增益;
S3,建立数据库,将所有先验参数的降阶基和S2求得的两种增益一一对应,保存在数据库中,其中降阶基作为机器学习分类器的学习基,选择合适的机器学习模型,以数据库中学习基为训练集,对应的两种增益参数为标签,设计分类器模型,该分类器模型即为LQG控制器。
2.根据权利要求1所述的一种基于数据驱动的LPV系统的LQG控制器的设计方法,其特征在于,所述S1的系统方程为
x(t;q(t))=A(q(t)x(t;q(t))+Bu(t;q(t))+w(t)
y(t;q(t))=Cx(t;q(t))+v(t)
其中,设其所有的t>0,系统矩阵A(q(t))∈Rn×n由时变参数q(t)∈Rd决定,从而得出时变系统矩阵,输入矩阵B∈Rn×n和输出矩阵C∈Rn×n都被认为是固定的;控制输入u(t;q(t))∈Rm,被控输出y(t;q(t))∈Rp,并且状态量x(t;q(t))∈Rn取决于参数,ω(t),ν(t)被分别称为随机过程中的测量过程和噪声过程,假设这些过程是白噪声,它是均值为零的不相关高斯分布。
3.根据权利要求1所述的一种基于数据驱动的LPV系统的LQG控制器的设计方法,其特征在于,所述S1的采样与降阶的过程包括:
设集合Q={q1,…,qm}来表示在系统运行期间可以期望的时变参数,对于给定参数qi,i=1,...,M,需要计算检测ΠD(qi),i=1,...,M,由它来提供系统状态的低维近似值,并且在之后用于检测参数变化,使用适当的正交分解(POD)方法来生成此检测依据;具体地:
首先将系统的快照存储在矩阵x(qi)=[x(t1;qi),x(t2;qi),...,x(ts;qi)]∈Rn*s中,然后,通过下面的公式一计算该快照矩阵的正交奇异值分解,得到一组正交向量与对应的奇异值;在给定奇异值阈值下,选取相应主导的基向量,再通过下面的公式二,计算由快照矩阵生成的检测基;其中,较大的特征值对应于系统的主要特征;
公式一:
x(qi)Tx(qi)=ΨΣΨT∈RS*S
公式二:
4.根据权利要求1所述的一种基于数据驱动的LPV系统的LQG控制器的设计方法,其特征在于,所述S2的实现过程包括:
针对在系统中存在测量噪声导致x(t)是无法得到的,因此使用估计的状态向量来近似x(t),通过实时积分跟随常微分方程来计算得到
其中,是估计的状态向量,是估计的输出向量,y(t)是状态向量,Kk是最优状态估计增益,使用滤波代数Riccati方程(FARE)计算最佳状态估计增益:
Kk(q)=Pk(q)CTV-1
然后使用估算的来代替精确的x(t)并且通过添加线性二次最优控制器来最小化函数损失方法来计算最佳状态反馈增益Kf:
5.根据权利要求1所述的一种基于数据驱动的LPV系统的LQG控制器的设计方法,其特征在于,所述S3的具体过程包括:
S3.1,对于每个选定的参数,使用LPV矩阵A(qi),B,C以及在系统运行期间测量噪声的对数矩阵W,V来计算两个LPV线性二次高斯反馈矩阵Kk(q)和Kf(q);
S3.2,将结果反馈矩阵存储在数据库中,所说数据库是一个在系统运行期间可以快速访问的内存库,并且,库中反馈增益矩阵可以快速的应对参数的变化。
S3.3,计算ki维学习基ΠL(qi),i=1,...,M,为在线学习降阶系统矩阵提供了低维基础,ΠL(q)=ΠD(q);数据库Γ储存最佳反馈增益Kk(qi)和Kf(qi),以及学习基ΠL(qi)和检测基ΠD(qi),其中i=1,…,M,如下所示:
技术研发人员:潘公宇,丁聪,张晓曼,王功强,
申请(专利权)人:江苏大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。