一种水下热滑翔机姿态调节的近似动态规划优化控制方法技术

技术编号:17778606 阅读:44 留言:0更新日期:2018-04-22 06:34
本发明专利技术公开了一种水下热滑翔机姿态调节的近似动态规划优化控制方法,包含:S1,设计近似动态规划控制器的代价函数,所述的近似动态规划控制器输出端连接水下热滑翔机被控对象;S2,设计近似动态规划控制器的值函数;S3,计算近似动态规划控制器的最优化执行输出方程;S4,在近似动态规划控制器之前并联连接两个单输入单输出自抗扰控制器,对两个单输入单输出自抗扰控制器分别控制输出两个控制信号;S5,对步骤S4得到的控制信号逆变换求出原控制输入信号,进而得到最优化执行输出。本发明专利技术只需通过实时状态反馈,就可以得到水下热滑翔机姿态调节的非线性最优化近似动态规划控制律。

【技术实现步骤摘要】
一种水下热滑翔机姿态调节的近似动态规划优化控制方法
本专利技术涉及优化控制和船舶与海洋工程
,特别涉及一种水下热滑翔机姿态调节的近似动态规划优化控制方法。
技术介绍
水下热滑翔机的运行之所以如此高率,就是因为它绝大部分运行时间都是在垂直平面内作稳定的锯齿型滑翔运动。在此前提状况下,通过调节水下热滑翔机内部纵向位置上的质量块位移,从而改变其上浮或下潜的俯仰角度,进而决定其净浮力变化的大小和速度。因此,对水下热滑翔机控制的关键,是通过对其纵向上质量块位移的控制输入,来确保其俯仰角和净浮力按预期的目标值保持或变化。这是一个单输入多输出欠驱动系统的优化控制问题。近似动态规划解决了动态规划的“维数灾”问题,是一种主流且应用广泛的多输入多输出动态系统优化控制方法。当前,近似动态规划的实现,主要是基于人工神经网络逼近,或者迭代逼近。因此,近似动态规划也常被称为神经动态规划。但是,基于人工神经网络的近似动态规划,需要大量的数据来离线学习和训练成功后,才能实际应用,并且自适应能力不强。基于迭代的近似动态规划,则存在迭代收敛的问题。它们都还不能较好地解决水下热滑翔机姿态调节的优化控制问题。所以,迫切需要一种不依赖于人工神经网络或者迭代逼近的近似动态规划优化控制方法,既能像PID控制方法那样自适应反馈调节,同时又能较好地解决多输入多输出耦合的优化控制问题,从而较好地解决水下热滑翔机姿态调节的优化控制问题,又专利技术了一种真正数据驱动的近似动态规划方法。
技术实现思路
为了克服已有技术的不足和缺陷,本专利技术提出一种不基于人工神经网络或者迭代逼近,而是采用新型近似动态规划优化的水下热滑翔机姿态调节控制方法:通过设计水下热滑翔机姿态调节近似动态规划优化控制方法的值函数为二次型形式,并通过近似动态规划方法的策略提高原理推导出其最优化执行输出的多项式表达式,然后引入两输入两输出耦合的自抗扰解耦控制方法,实时反馈得出上述最优化执行输出表达式中的可变系数,从而最终只需通过实时状态反馈,就可以得到水下热滑翔机姿态调节的非线性最优化近似动态规划控制律。为了实现以上目的,本专利技术是通过以下技术方案实现的:一种水下热滑翔机姿态调节的近似动态规划优化控制方法,其特点是,包含如下步骤:S1,设计近似动态规划控制器的代价函数,所述的近似动态规划控制器输出端连接水下热滑翔机被控对象;S2,设计近似动态规划控制器的值函数;S3,计算近似动态规划控制器的最优化执行输出方程;S4,在近似动态规划控制器之前并联连接两个单输入单输出自抗扰控制器,对两个单输入单输出自抗扰控制器分别控制输出两个控制信号;S5,对步骤S4得到的控制信号逆变换求出原控制输入信号,进而得到最优化执行输出。所述的步骤S1中近似动态规划控制器的代价函数定义为:γ[x(t),u(t),t]=a1Δθ2(t)+a2Δm02(t)+a3u2(t)(1)其中,γ[x(t),u(t),t]表示t时刻的代价函数,其与水下热滑翔机状态x(t),控制输入u(t)以及当前所处时刻t都有关,Δθ(t)表示当前时刻的俯仰角与控制目标值之差;Δm0(t)表示当前时刻的净浮力与其控制目标值之差;u(t)表示当前时刻的控制输入;a1,a2和a3表示与其相乘变量的被优化权重系数,这里可均取为1。所述的步骤S2中采用等价的二次型形式,将近似动态规划控制器的值函数设计为:其中,α是折扣因子;u(t)表示当前时刻的控制输入;P(t)是二次型值函数的上三角权矩阵,其元素r11(t),r12(t),r13(t),r22(t),r23(t),r33(t)是随时间的可变系数。所述的步骤S3中根据近似动态规划方法的策略提高原理方程(4),通过求值函数Q(θ(t),m0(t),u(t))对控制输入信号u(t)的偏导,从而推导出可变系数的最优化执行输出u(t)的多项式表达式,即方程(6):其中,u*(t)表示当前时刻的最优化控制输入;θ(t)表示当前时刻的俯仰角;m0(t)表示当前时刻的净浮力;l1(t),l2(t)表示用来逼近的可变系数的新表达形式。所述的步骤S4包含:在近似动态规划控制器之前并联连接第一单输入单输出自抗扰控制器和第二单输入单输出自抗扰控制器,第一单输入单输出自抗扰控制器的输入为当前时刻的俯仰角与其控制目标值之差,第二单输入单输出自抗扰控制器的输入为当前时刻的净浮力与其控制目标值之差;系统方程如下:控制输入信号放大系数为:其中,是未知的水下热滑翔机对象模型;y1,y2是水下热滑翔机的俯仰角和净浮力输出状态;将方程(6)中的最优化执行输出u(t)代入上述方程(7),可得:则在方程(9)中,新的控制输入信号变为l1(t),l2(t),且方程(9)控制输入信号放大系数变为:将上述方程(9)解耦成如下两个单输入单输出系统,用第一、二单输入单输出自抗扰控制器分别实行控制,并能分别输出控制信号U1,U2:所述的步骤S5中对第一、二单输入单输出自抗扰控制器输出的控制信号U1,U2,通过逆变换,可求出其原控制输入信号,所述的原控制输入信号即为近似动态规划控制器的优化执行输出u(t)多项式表达式的可变系数l1(t),l2(t):若C-1奇异,可将其矩阵系数设为1,近似动态规划控制器的最优化执行输出u(t)为:所述的步骤S5后还包含:S6,通过所述步骤S5得到的最优化执行输出调节水下热滑翔机被控对象动作,并该时刻水下热滑翔机被控对象的俯仰角及其净浮力值,与其目标值比较,得到当前时刻的俯仰角与控制目标值之差和当前时刻的净浮力与其控制目标值之差再反馈回步骤S4中的两个单输入单输出自抗扰控制器,循环直到最优。本专利技术与现有技术相比,具有以下优点:本专利技术设计一种水下热滑翔机姿态调节的新型近似动态规划优化控制方法,通过设计二次型值函数及其极值求导,结合两输入两输出自抗扰解耦控制求得可变系数的近似动态规划最优化执行输出表达式,从而最终只需要通过实时状态反馈,就可以得到水下热滑翔机姿态调节的非线性最优化近似动态规划控制律。该方法不依赖于人工神经网络或者迭代逼近的近似动态规划优化控制方法,既能像PID控制方法那样自适应反馈调节,同时又能较好地实现多输入多输出耦合的优化控制,从而较好地解决水下热滑翔机姿态调节的优化控制问题,又专利技术了一种真正数据驱动的近似动态规划方法。附图说明图1为本专利技术水下热滑翔机姿态调节的近似动态规划优化控制方法的流程图;图2为本专利技术水下热滑翔机姿态调节的新型近似动态规划优化控制方法的结构和原理示意图。具体实施方式以下结合附图,通过详细说明一个较佳的具体实施例,对本专利技术做进一步阐述。如图1所示,一种水下热滑翔机姿态调节的近似动态规划优化控制方法,包含如下步骤:S1,设计近似动态规划控制器的代价函数,所述的近似动态规划控制器输出端连接水下热滑翔机被控对象;S2,设计近似动态规划控制器的值函数;S3,计算近似动态规划控制器的最优化执行输出方程;S4,在近似动态规划控制器之前并联连接两个单输入单输出自抗扰控制器,对两个单输入单输出自抗扰控制器分别控制输出两个控制信号;S5,对步骤S4得到的控制信号逆变换求出原控制输入信号,进而得到最优化执行输出。所述的步骤S1中近似动态规划控制器的代价函数定义为:γ[x(t),u(t),t]=a1Δθ2(t)+本文档来自技高网...
一种水下热滑翔机姿态调节的近似动态规划优化控制方法

【技术保护点】
一种水下热滑翔机姿态调节的近似动态规划优化控制方法,其特征在于,包含如下步骤:S1,设计近似动态规划控制器的代价函数,所述的近似动态规划控制器输出端连接水下热滑翔机被控对象;S2,设计近似动态规划控制器的值函数;S3,计算近似动态规划控制器的最优化执行输出方程;S4,在近似动态规划控制器之前并联连接两个单输入单输出自抗扰控制器,对两个单输入单输出自抗扰控制器分别控制输出两个控制信号;S5,对步骤S4得到的控制信号逆变换求出原控制输入信号,进而得到最优化执行输出。

【技术特征摘要】
1.一种水下热滑翔机姿态调节的近似动态规划优化控制方法,其特征在于,包含如下步骤:S1,设计近似动态规划控制器的代价函数,所述的近似动态规划控制器输出端连接水下热滑翔机被控对象;S2,设计近似动态规划控制器的值函数;S3,计算近似动态规划控制器的最优化执行输出方程;S4,在近似动态规划控制器之前并联连接两个单输入单输出自抗扰控制器,对两个单输入单输出自抗扰控制器分别控制输出两个控制信号;S5,对步骤S4得到的控制信号逆变换求出原控制输入信号,进而得到最优化执行输出。2.如权利要求1所述的水下热滑翔机姿态调节的近似动态规划优化控制方法,其特征在于,所述的步骤S1中近似动态规划控制器的代价函数定义为:γ[x(t),u(t),t]=a1Δθ2(t)+a2Δm02(t)+a3u2(t)(1)其中,γ[x(t),u(t),t]表示t时刻的代价函数,其与水下热滑翔机状态x(t),控制输入u(t)以及当前所处时刻t都有关,Δθ(t)表示当前时刻的俯仰角与控制目标值之差;Δm0(t)表示当前时刻的净浮力与其控制目标值之差;u(t)表示当前时刻的控制输入;a1,a2和a3表示与其相乘变量的被优化权重系数,这里可均取为1。3.如权利要求2所述的水下热滑翔机姿态调节的近似动态规划优化控制方法,其特征在于,所述的步骤S2中采用等价的二次型形式,将近似动态规划控制器的值函数设计为:其中,α是折扣因子;u(t)表示当前时刻的控制输入;P(t)是二次型值函数的上三角权矩阵,其元素r11(t),r12(t),r13(t),r22(t),r23(t),r33(t)是随时间的可变系数。4.如权利要求3所述的水下热滑翔机姿态调节的近似动态规划优化控制方法,其特征在于,所述的步骤S3中根据近似动态规划方法的策略提高原理方程(4),通过求值函数Q(θ(t),m0(t),u(t))对控制输入信号u(t)的偏导,从而推导出可变系数的最优化执行输出u(t)的多项式表达式,即方程(6):其中,u*(t)表示当前时刻的最优化控制输入;θ(t)表示当前时刻的俯仰角;m0(t)表示当前时刻的净浮力;l1(t),l2(t)表示用来逼近的可变系数的新表达形式。5.如权利要求4所述的水下热滑翔机姿态调节的近似动态规划优化控制方法,其特征在于,所述的步骤S4包含:在近似动态规划控制器之前并联连接第一单输入单输出自抗扰控制器和第二单输入单输出自抗扰控制器...

【专利技术属性】
技术研发人员:黄志坚郑欢张成王升堂陈文涛张琴
申请(专利权)人:上海海事大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1