基于集成迁移学习的中段制导方法技术

技术编号:37708726 阅读:15 留言:0更新日期:2023-06-01 23:59
本发明专利技术公开了一种基于集成迁移学习的制导方法(ETLS),该方法不仅能实时生成最优制导命令,还能在场景发生变化后,只用很少的新数据进行微调就能快速适应新的工作环境,并且性能几乎和之前一样好;该方法将多个传统的训练好的DNN神经网络与元学习器相结合,将新飞行器的中段制导最优控制问题,简化为寻找最优加权函数和最优偏置函数的问题,而且这两个函数可以用少量数据快速确定,避免了重新训练一个新网络的耗时和数据不足问题,从而针对新的飞行器及新的应用场景,能够在极短时间内给出满足末速度和精度要求的中制导段控制指令。足末速度和精度要求的中制导段控制指令。

【技术实现步骤摘要】
基于集成迁移学习的中段制导方法


[0001]本专利技术涉及飞行器中段制导方法,具体涉及一种基于集成迁移学习的中段制导方法。

技术介绍

[0002]在飞行器执行任务过程中,飞行器要经历发射、中段制导和末段制导三个阶段。其中,中段制导过程耗时最长,也是飞行器制导过程中最关键的一步。
[0003]制导系统是导弹高命中率的核心,制导算法的好坏会直接影响导弹的命中精度。目前被广泛使用的算法是较为成熟的解析方法和数值方法等,称为传统制导算法,能够在可预见的范围内保证较高的制导精度。近几年,学者们将机器学习方法引入制导领域,从而诞生了一系列新兴的基于数据的制导算法,代表性的有深度学习和强化学习制导算法。这些方法的特点是需要大量的数据和大量时间训练深度神经网络(DNN)。一旦训练完毕,深度神经网络就能以较少的计算代价快速生成结果。
[0004]然而,这种方法的一个固有缺陷是泛化能力差。经过良好训练的深度神经网络通常无法在全新的任务场景中提供满意的性能,甚至在多数情况下无法正常工作。这意味着当应用场景发生变化时,需要重新训练新的DNN。但由于训练过程非常耗时,且需要大量的标记数据,对于那些只能提供少量数据或时间限制较为严格的任务来说,基于数据的制导算法很难应用。
[0005]基于此,在设计出一个新的飞行器时,或者将成熟飞行器应用到新的应用场景中时,该飞行器在中制导段的控制系统,由于缺乏足够的数据冲刷,该控制系统给出的控制指令往往不能满足制导需求,飞行器不能在中制导段得到最大末速度,并且还会影响最终的命中精度。<br/>[0006]基于上述问题,本专利技术人对基于数据的中制导段的制导方法做了深入分析,以期待设计出一种能够解决上述问题的基于集成迁移学习的制导方法(ETLS)。

技术实现思路

[0007]为了克服上述问题,本专利技术人进行了锐意研究,设计出一种基于集成迁移学习的制导方法(ETLS),该方法不仅能实时生成最优制导命令,还能在场景发生变化后,只用很少的新数据进行微调就能快速适应新的工作环境,并且性能几乎和之前一样好;该方法将多个传统的训练好的DNN神经网络与元学习器相结合,将新飞行器的中段制导最优控制问题,简化为寻找最优加权函数和最优偏置函数的问题,而且这两个函数可以用少量数据快速确定,避免了重新训练一个新网络的耗时和数据不足问题,从而针对新的飞行器及新的应用场景,能够在极短时间内给出满足末速度和精度要求的中制导段控制指令,从而完成本专利技术。
[0008]具体来说,本专利技术的目的在于提供一种基于集成迁移学习的中段制导方法,其特征在于,该方法中,在中制导段,实时获得最优控制指令a
cnew
;通过该最优控制指令a
cnew
控制
飞行器的舵机打舵工作,使得飞行器按照预定轨迹飞行,进而完成末速度最大化的中段制导任务。
[0009]其中,通过实时将飞行器的状态向量S输入到预先训练好的网络E实时获得所述最优控制指令a
cnew

[0010]其中,所述网络E的训练过程包括如下步骤:
[0011]步骤1,训练获得至少5个DNN神经网络,组成基学习器;
[0012]步骤2,将基学习器与元学习器相连得到网络E,即将基学习器的输出作为元学习器的输入;
[0013]步骤3,通过少量的飞行器训练数据对网络E进行训练,即可得到所述训练好的网络E。
[0014]其中,在所述步骤1中,所述至少5个DNN神经网络中,每个DNN神经网络都对应一种应用场景,即各个DNN神经网络针对的应用场景各不相同。
[0015]其中,在所述步骤1中,所述DNN神经网络为深度前馈神经网络,该DNN神经网络拥有3个隐藏层,每层20个神经元,每个隐藏层的神经元都与上一层神经元进行全连接。
[0016]其中,在所述步骤1中,所述DNN神经网络的训练过程包括:
[0017]步骤a,对训练数据进行归一化和分组;
[0018]步骤b,向DNN神经网络输入训练集数据,并将预测值与训练集中的标准值进行比较,得出一个损失;
[0019]步骤c,误差反向传播,参数更新;
[0020]步骤d,当神经网络完成一次训练后,将验证集和测试集数据输入神经网络并计算出网络的损失值,作为神经网络泛化能力的测量指标;当所述损失值降低到设定值或到达最大epoch时停止训练。
[0021]其中,所述元学习器为单隐层前馈神经网络,元学习器的输入至少有5个,即至少5个DNN神经网络的输出是所述元学习器的输入;所述元学习器的输出为最优控制指令a
cnew

[0022]其中,所述单隐层前馈神经网络中的算法为:
[0023][0024]其中,i表示单隐层前馈神经网络输入的编号;
[0025]N表示单隐层前馈神经网络输入的数量;
[0026]a
ci
表示单隐层前馈神经网络的第i个输入;
[0027]C
j
表示加权函数;
[0028]b
j
表示偏置函数。
[0029]其中,在步骤3中,所述少量是指少于500组数据。
[0030]本专利技术所具有的有益效果包括:
[0031](1)根据本专利技术提供的基于集成迁移学习的中段制导方法中,首先针对不同的空气动力学模型分别训练几个神经网络,称为基学习器,然后利用一个小型前馈神经网络来学习从旧的最优控制到新环境下的最优控制的映射关系,从而能够快速适应数据不足的新环境;
[0032](2)根据本专利技术提供的基于集成迁移学习的中段制导方法,可以在保证制导性能的情况下,大大减少训练数据;
[0033](3)根据本专利技术提供的基于集成迁移学习的中段制导方法,只需几秒钟就能完成对新环境的适应,适用于对时间要求严格的情况下使用;
[0034](4)根据本专利技术提供的基于集成迁移学习的中段制导方法,可以灵活地应用于其他场景,例如最小控制能量制导,最小时间制导等场景中。
附图说明
[0035]图1示出根据本专利技术一种优选实施方式的DNN神经网络结构示意图;
[0036]图2示出同一初始条件下不同气动参数时的最优制导指令;
[0037]图3示出根据本专利技术一种优选实施方式的元学习器结构示意图;
[0038]图4示出实施例1中不同神经元数量下的元学习器的训练损失和验证损失示意图;
[0039]图5示出实施例2中位置误差比较示意图;
[0040]图6示出实施例2中速度误差比较示意图;
[0041]图7示出实施例2中终端角度误差比较示意图;
[0042]图8示出实施例2中时间误差比较示意图;
[0043]图9示出实施例3中位置误差比较示意图;
[0044]图10示出实施例3中速度误差比较示意图;
[0045]图11示出实施例3中终端角度误差比较示意图;
[0046]图12示出实施例3中时间误差比较示意图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于集成迁移学习的中段制导方法,其特征在于,该方法中,在中制导段,实时获得最优控制指令a
cnew
;通过该最优控制指令a
cnew
控制飞行器的舵机打舵工作,使得飞行器按照预定轨迹飞行,进而完成末速度最大化的中段制导任务。2.根据权利要求1所述的基于集成迁移学习的中段制导方法,其特征在于,通过实时将飞行器的状态向量S输入到预先训练好的网络E实时获得所述最优控制指令a
cnew
。3.根据权利要求1所述的基于集成迁移学习的中段制导方法,其特征在于,所述网络E的训练过程包括如下步骤:步骤1,训练获得至少5个DNN神经网络,组成基学习器;步骤2,将基学习器与元学习器相连得到网络E,即将基学习器的输出作为元学习器的输入;步骤3,通过少量的飞行器训练数据对网络E进行训练,即可得到所述训练好的网络E。4.根据权利要求3所述的基于集成迁移学习的中段制导方法,其特征在于,在所述步骤1中,所述至少5个DNN神经网络中,每个DNN神经网络都对应一种应用场景,即各个DNN神经网络针对的应用场景各不相同。5.根据权利要求3所述的基于集成迁移学习的中段制导方法,其特征在于,在所述步骤1中,所述DNN神经网络为深度前馈神经网络,该DNN神经网络拥有3个隐藏层,每层20个神经元,每个隐藏层的神经元都与上一层神经元进行全连...

【专利技术属性】
技术研发人员:何绍溟金天宇王江李虹言刘子超
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1