一种切换系统的数据驱动最优切换控制方法技术方案

技术编号：36803233 阅读：60 留言：0更新日期：2023-03-08 23:58

本发明专利技术公开了一种切换系统的数据驱动最优切换控制方法。本发明专利技术首先明确最优控制策略使切换系统在无限时间区域代价最小；然后推导基于有限时域HJB方程的最优解，其从某个正定函数出发，根据偏导获得值函数的逼近式；并引入形式为基函数与权值相乘的近似函数替代逼近式中的未知量；即可利用状态数据矩阵估计所述逼近式中近似函数的权值；最后不断更新权值估计值直至近似最优权值，进而代入无限时域HJB方程计算得最优代价和最优切换控制策略。该方法仅需要状态数据，无需子系统模型，即可实现切换系统的最优切换控制，不依赖于系统模型，适用于切换系统子系统模型未知的情况。适用于切换系统子系统模型未知的情况。适用于切换系统子系统模型未知的情况。

全部详细技术资料下载

【技术实现步骤摘要】
一种切换系统的数据驱动最优切换控制方法

[0001]本专利技术涉及切换控制
，具体涉及一种切换系统的数据驱动最优切换控制方法。

技术介绍

[0002]在切换系统控制中，由于各类不确定性的存在，可能难以获得子系统模型或者精确的子系统模型，此时传统的基于模型的方法已经不能解决问题或者难以保证良好的性能。因此，如果在控制过程中不能准确得到系统模型，就需要研究一种不依赖于系统模型的切换控制方法。
[0003]工业过程中产生大量的过程数据，其中包括有价值的状态信息，利用这些在线和离线的数据，可以直接设计控制器、评估性能、做出决策等等。本专利技术的数据驱动切换控制方法就是利用这些数据替代切换子系统模型来设计控制器。

技术实现思路

[0004]本专利技术针对切换系统子系统模型未知的情况，提供了一种切换系统的数据驱动最优切换控制方法，仅需要状态数据，无需子系统模型，即可实现切换系统的最优切换控制。
[0005]本专利技术的切换系统的数据驱动最优切换控制方法，首先，设计的最优控制策略使切换系统在无限时间区

【技术保护点】

【技术特征摘要】
1.一种切换系统的数据驱动最优切换控制方法，其特征在于，设计最优控制策略使切换系统在无限时间区域代价最小；采用切换系统无限时域HJB方程构建无限时域最优控制策略(v，μ)的表达式；其中，HJB方程的v表示切换系统的子系统，μ表示子系统的控制量；采用切换系统有限时域HJB方程构建有限时域最优控制策略表达式；基于有限时域HJB方程的最优解表达式，从某个正定函数出发，根据偏导获得值函数的逼近式；将所述逼近式中的部分未知量用近似函数替代，所述未知量包括控制量μ和值函数，所述值函数为区域代价，所述近似函数为基函数与权值的乘积；利用状态数据矩阵估计所述逼近式中的权值，得到近似最优权值；基于近似最优权值得到最优值函数；将最优值函数带入无限时域最优控制策略表达式，即可得到最优控制策略。2.如权利要求1所述的切换系统的数据驱动最优切换控制方法，其特征在于，切换系统为：其中，x(t)∈R
n
为系统状态，该状态量是可测的；u(t)为系统控制量输入；v∈V代表当前活跃子系统的索引，V＝{1,2,...,N}是所有子系统的索引集合，N是子系统数量；f
v
:R
n
×
R
m
→
R
n
是子系统v的未知模型；x(0)＝x0∈Ω是初始状态，是待研究状态区域，包括原点；无限时间区域代价函数为：其中，Q:R
n
×
R
m
→
R是正定函数；控制输入定义成状态反馈的形式，即：μ(x(t))＝u(t)；在优化过程中，从时刻t的状态x(t)∈Ω开始到无穷时间区域的代价定义为：满足：3.如权利要求2所述的切换系统的数据驱动最优切换控制方法，其特征在于，无限时域HJB方程为:其中上标*代表最优值，x＝x(t)，当(
·
)为标量时，相应的最优切换控制策略(v
*
,μ
*
)为：4.如权利要求2或3所述的切换系统的数据驱动最优切...

【专利技术属性】
技术研发人员：甘明刚，张弛，陈杰，于肖雯，薛晨琛，赵金刚，刘晓舟，
申请(专利权)人：中国兵器装备集团兵器装备研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人