复合控制飞行器元学习智能控制方法技术

技术编号:34350271 阅读:44 留言:0更新日期:2022-07-31 05:35
本发明专利技术提供一种复合控制飞行器自动驾驶仪元学习智能控制方法,所述方法包括步骤一:建立未知干扰环境下的复合控制飞行器纵向平面动力学模型;步骤二:基于元学习框架对真实系统下采集的数据进行元训练以深度神经网络获得未知干扰的泛化参数;步骤三:在建立步骤一所述模型的基础上为避免采用反步造成微分爆炸现象首先对模型进行变量代换,并构造有界函数和终端滑模面,结合步骤二中获得的深度神经网络对系统受到的未知干扰进行准确估计,通过设计终端滑模控制律使得气流角在有效时间内收敛至期望值。本发明专利技术考虑了干扰对飞行过程中控制系统的影响,设计控制律使得飞行器自动驾驶仪能够快速准确跟踪参考信号。驾驶仪能够快速准确跟踪参考信号。驾驶仪能够快速准确跟踪参考信号。

Meta learning intelligent control method for compound control aircraft

【技术实现步骤摘要】
复合控制飞行器元学习智能控制方法


[0001]本专利技术属于飞行控制系统领域,具体涉及到一种复合控制飞行器自动驾驶仪系统元学习智能控制方法。

技术介绍

[0002]防空导弹作为各国防空利器,成为许多国家重点。其担负着对国家领空的防御任务,一旦任务失败,将会给国家安全和人民利益带来巨大的损失。与传统飞行器只使用气动力不同,复合控制飞行器利用姿控发动机能够产生连续高速气体的特点帮助飞行器更快建立稳定的法向过载,因此复合控制飞行器总是能够实现极小的脱靶量,甚至是直接命中目标。但是在拦截过程中由于受到系统参数不确定性和外部扰动的复合干扰影响,设计对干扰具有良好鲁棒性的飞行控制系统是必不可少的。
[0003]传统飞行控制方法采用增益调度和比例积分微分控制器,而复合控制飞行器气动环境复杂,干扰和不确定性大,并且其是过驱动系统,因此采用传统飞行控制方法对其飞行过程进行高精度控制存在一定的难度。为解决上述问题,许多学者提出了先进控制理论,如滑模控制、自适应神经网络控制、自抗扰控制和反步控制等方法。其中滑模控制和反步控制被常用来结合设计控制器,滑模控制具有对参数不确定性、外部干扰不敏感和容错能力强等优点,但是其中引入的切换项对系统的过渡过程和实际控制律产生抖振影响;反步法将控制系统形式要求进行拓宽,因此具有很强的泛化适应能力,但是反步法将高阶系统拆分为多个一阶子系统并通过引入虚拟变量的形式将他们级联起来的方式易造成“微分爆炸”。
[0004]基于此,本专利技术在上述终端滑模控制律基础上,提出了基于元学习深度神经网络的抗干扰控制器,主要优势为:(1)无需得知系统准确模型,对系统建模精确性要求较低。(2)通过构造有界函数和反馈线性化形式有效避免了反步法的“微分爆炸”。(3)通过合理的控制分配策略有效避免了气动舵饱和偏转的现象。(4)利用元学习框架特点使得深度神经网络能够有效估计当前系统受到的未知干扰并提高系统的控制精度。

技术实现思路

[0005]本专利技术的目的是为了解决复合控制飞行器自动驾驶仪受到外部干扰、系统模型参数摄动的情况下的高精度控制问题。
[0006]本专利技术采用的技术方案为:
[0007]本专利技术提供一种基于元学习深度神经网络的复合控制飞行器自动驾驶仪抗干扰控制方法,所述方法包括:
[0008]步骤一:建立复合控制飞行器自动驾驶仪纵向通道动力学模型;
[0009]步骤二:利用反馈线性化将步骤一中的系统模型转化为合适的形式,便于后续设计终端滑模面;
[0010]步骤三:利用反步法和扩张状态观测器对步骤一中建立的系统模型在不同的未知干扰环境中控制运行并获得干扰的实际值和估计值;
[0011]步骤四:基于元学习框架利用步骤三中获得的数据对深度神经网络进行训练,并训练多个能够准确估计干扰的神经网络模型作为对未知干扰具有泛化估计的元参数;
[0012]步骤五:基于步骤四中训练好的深度神经网络在线估计未知干扰,并在设计终端滑模控制律的过程中考虑干扰的估计对干扰进行补偿,从而使得系统气流角在有限时间内跟踪期望值。
[0013]本专利技术的优点在于:
[0014](1)设计有界函数和反馈线性化有效避免引入虚拟控制量分步设计的过程,直接针对复合控制飞行器非线性自动驾驶仪系统模型进行控制律设计。
[0015](2)在控制律设计中考虑对上下界未知的干扰进行补偿。
[0016](3)通过引入元学习框架来提高深度神经网络对从未训练过的环境中系统受到的未知干扰的估计精度,增强深度神经网络的泛化能力。
附图说明
[0017]图1为复合控制飞行器的直接力分布示意图
[0018]图2为智能元学习深度神经网络控制器结构图
[0019]图3为深度神经网络在测试过程中对测试数据1中的干扰估计情况
[0020]图4为深度神经网络在测试过程中对测试数据2中的干扰估计情况
[0021]图5为实施例中智能元学习深度神经网络控制方法的攻角曲线
[0022]图6为实施例中智能元学习深度神经网络控制方法的攻角跟踪误差曲线
[0023]图7为实施例中智能元学习深度神经网络控制方法的未知干扰估计曲线
[0024]图8为实施例中智能元学习深度神经网络控制方法的气动舵偏转曲线
[0025]图9为实施例中智能元学习深度神经网络控制方法的直接力响应曲线
具体实施方式
[0026]下面将结合附图及实施例对本专利技术作进一步的详细说明。
[0027]考虑末制导阶段飞行器推力发动机已停止工作,因此建立纵向平面内直复合控制飞行器自动驾驶仪非线性系统模型如下:
[0028][0029]式中:m为飞行器质量;V为飞行器速度;α为迎角;β为侧滑角;Q为动压;S为特征面积;L为特征长度;J
z
为飞行器转动惯量;为气动导数;δ
z
为升降舵偏角;L
T
为姿控发动机到飞行器质心的平均距离;F
T
为姿控发动机推力大小。
[0030]为便于设计,对上式进行简化,假设β≈0,并且为下文公式表达更简洁,令为便于设计,对上式进行简化,假设β≈0,并且为下文公式表达更简洁,令并且定义x1=α,x2=ω
z
,M=a4δ
z
+a5F
T
,则可以得到直接力/气动力复合控制飞行器的纵向通道简化模型:
[0031][0032]式中,d
α
,为考虑模型简化过程中系统存在的复合未知有界干扰。
[0033]通过引入中间状态量进而化简上式,令x3=x2‑
a1x1,则上式可以写成:
[0034][0035]将x2=x3+a1x1带入上式得:
[0036][0037]设参考指令信号为x
1d
,令e1=x1‑
x
1d
,则再令x2=x3,则上式可以改写为:
[0038][0039]在获得上述模型之后,利用反步法和扩张状态观测器对上述系统模型在T个不同任务环境中进行有效控制,每个任务环境代表一种期望轨迹和干扰形式,并且设置每个任务的运行时长都是10秒,且数据采集间隔为1毫秒,则每个任务的数据量都是10000,收集的离线数据集合为其中X,X
r
分别为系统状态和参考状态,为扩张状态观测器对两个回路中的干扰的准确估计值。元训练的目标是找到具有强泛化能力的元参数ω
*
,并利用其来表达被训练神经网络内核以达到对这些训练后的神经网络内核进行线性组合进而表达系统在实际运行过程中所受到的未知扰动:
[0040][0041]式中,为神经网络输出层与最后一层隐藏层之间的权重,它是与表示环境变化的参数c有关;为输出层之前的第j个隐藏层的状态。因此元训练的目标是最小化真实扰动与线性表达干扰之间的误差,即:
[0042][0043]式中,为元参数;为神经网络最后一层隐藏层的状态。
[0044]接下来本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种复合控制飞行器元学习智能控制方法,其特征在于,所述方法包括:步骤一:建立复合控制飞行器自动驾驶仪纵向通道动力学模型;步骤二:利用反馈线性化将步骤一中的系统模型转化为合适的形式,便于后续设计终端滑模面;步骤三:利用反步法和扩张状态观测器对步骤一中建立的系统模型在不同的未知干扰环境中控制运行并获得干扰的实际值和估计值;步骤四:基于元学习框架利用步骤三中获得的数据对深度神经网络进行训练,并训练多个能够准确估计干扰的神经网络模型作为对未知干扰具有泛化估计的元参数;步骤五:基于步骤四中训练好的深度神经网络在线估计未知干扰,并在设计终端滑模控制律的过程中考虑干扰的估计对干扰进行补偿,从而使得系统气流角在有限时间内跟踪期望值。2.根据权利要求1所述方法,其特征在于,步骤一所述复合控制飞行器自动驾驶仪纵向通道动力学模型的建立过程为:考虑末制导阶段导弹推力发动机已停止工作,因此建立纵向平面内直复合控制飞行器自动驾驶仪非线性系统模型如下:式中:m为飞行器质量;V为飞行器速度;α为迎角;β为侧滑角;Q为动压;S为特征面积;L为特征长度;J
z
为飞行器转动惯量;为气动导数;δ
z
为升降舵偏角;L
T
为姿控发动机到飞行器质心的平均距离;F
T
为姿控发动机推力大小。3.根据权利要求1所述方法,其特征在于,步骤二所述对系统进行反馈线性化的过程为:为便于设计,对上式进行简化,假设β≈0,并且为下文公式表达更简洁,令为便于设计,对上式进行简化,假设β≈0,并且为下文公式表达更简洁,令并且定义x1=α,x2=ω
z
,M=a4δ
z
+a5F
T
,则可以得到直接力/气动力复合控制飞行器的纵向通道简化模型:式中,d

【专利技术属性】
技术研发人员:熊佳富李君龙张锐冉茂鹏楼朝飞
申请(专利权)人:北京航空航天大学北京电子工程总体研究所
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1