基于门控渐进式神经网络的计算制导方法技术

技术编号:39741264 阅读:7 留言:0更新日期:2023-12-17 23:42
本发明专利技术公开了一种基于门控渐进式神经网络的计算制导方法,包括以下步骤:采用原始任务的训练数据,预训练门控渐进式神经网络,获得初始网络,采用初始网络输出飞行器偏置加速度,根据偏置加速度获得飞行器的制导律;当制导任务改变后,采用新任务的训练数据,对初始网络再训练,获得更新网络,采用更新网络输出飞行器偏置加速度,根据偏置加速度获得飞行器的制导律

【技术实现步骤摘要】
基于门控渐进式神经网络的计算制导方法


[0001]本专利技术涉及一种基于门控渐进式神经网络的计算制导方法,属于制导



技术介绍

[0002]计算制导主要可以划分为两类:基于模型的计算制导和基于数据的计算制导

[0003]其中,基于模型的计算制导方法是根据导弹飞行动力学和制导律等数学模型,通过优化算法寻找最优解的制导方法

但是这种方法需要准确的模型,在实际情况中,由于飞行环境

目标动态等因素的影响,飞行器飞行的真实模型往往很难获取

基于数据的计算制导方法则是通过学习大量的历史数据,从中提取有用的信息并进行决策

这类方法的优点是不需要准确的模型,而且能够处理模型复杂或者不确定的情况

例如,深度学习等机器学习方法就是基于数据的计算制导的代表

这种方法通过训练大量数据,可以学习到制导过程中的复杂模式,并进行有效决策

[0004]然而当任务环境发生改变时,预训练好的制导模型表现并不理想

为获得适用于新制导任务环境中的制导模型,需要大量的数据和时间成本,这在实际应用中是不现实的

[0005]现有技术中有将渐进式神经网络替代传统神经网络进行增量学习,通过增加列网络的方法,使得新制导任务的学习过程中不会忘记旧的制导任务,从而降低新环境制导任务训练数据量,实现在新环境中的精准制导,但是将渐进式神经网络中特殊的横向连接方式会造成网络参数随着任务数的增多而爆炸式增长的现象,从而导致适应后续任务的时间成本陡增

[0006]因此,有必要对现有的基于数据的计算制导方法进一步研究,以解决上述问题


技术实现思路

[0007]为了克服上述问题,本专利技术人进行了深入研究,提供了一种基于门控渐进式神经网络的计算制导方法,包括以下步骤:
[0008]采用原始任务的训练数据,预训练门控渐进式神经网络,获得初始网络,采用初始网络输出飞行器偏置加速度,根据偏置加速度获得飞行器的制导律;
[0009]当制导任务改变后,采用新任务的训练数据,对初始网络再训练,获得更新网络,采用更新网络输出飞行器偏置加速度,根据偏置加速度获得飞行器的制导律

[0010]在一个优选的实施方式中,所述门控渐进式神经网络,包括一列或多列任务单元,每个列任务单元均具有一个输入层

一个或多个隐含层

一个输出层;不同列任务单元之间具有横向连接

[0011]在一个优选的实施方式中,所述再训练包括以下步骤:
[0012]在初始网络中增加新列任务单元,在新列任务单元与旧列任务单元之间建立横向连接,形成新的渐进式神经网络;
[0013]采用新任务的训练数据训练新的渐进式神经网络,获得更新网络

[0014]在一个优选的实施方式中,所述新列任务单元输入层的输入,包含神经网络输入
数据以及所有旧列任务单元输出层的输出量

[0015]在一个优选的实施方式中,在新列任务单元输入层的输入中,为旧列任务单元输出层的输出量设置有权重参数

[0016]在一个优选的实施方式中,所述权重参数为自适应参数

[0017]在一个优选的实施方式中,再训练过程中,旧任务单元中的参数冻结

[0018]在一个优选的实施方式中,所述训练数据包括飞行器的飞行状态量和制导律,其中飞行状态量为神经网络的输入量,飞行器偏置加速度为神经网络的输出量

[0019]在一个优选的实施方式中,再训练过程中,采用均方误差作为训练新列的损失函数
[0020]在一个优选的实施方式中,所述训练数据通过以下方式获取:
[0021]建立飞行器的动力学模型;
[0022]设置最优控制目标,根据动力学模型获得多组飞行器飞行状态量及对应的飞行器偏置加速度

[0023]本专利技术所具有的有益效果包括:
[0024](1)
简化了
PNN
网络,避免由任务增加引起的网络参数的爆炸性增长,降低了训练对运算量的需求;
[0025](2)
提出了一种门控机制来促进知识转移,以缓解由于网络简化而导致的不同任务之间的知识转移的弱点;
[0026](3)
制导方法能够在新数据较少的情况下快速适应新的空气动力学环境,能迅速适应新环境下的任务需求,相比传统深度学习制导节省了大量时间成本,极大地提高了制导律的部署效率

附图说明
[0027]图1示出根据本专利技术一种优选实施方式的基于门控渐进式神经网络的计算制导方法流程示意图;
[0028]图2示出了传统渐进式神经网络构架示意图;
[0029]图3示出了本专利技术一种优选实施方式的门控渐进式神经网络构架示意图;
[0030]图4示出了实施例1与对比例1中的实验结构

具体实施方式
[0031]下面通过附图和实施例对本专利技术进一步详细说明

通过这些说明,本专利技术的特点和优点将变得更为清楚明确

[0032]在这里专用的词“示例性”意为“用作例子

实施例或说明性”。
这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例

尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图

[0033]根据本专利技术提供的一种基于门控渐进式神经网络的计算制导方法,如图1所示,包括以下步骤:
[0034]采用原始任务的训练数据,预训练门控渐进式神经网络,获得初始网络,采用初始网络输出飞行器偏置加速度,根据偏置加速度获得飞行器的制导律;
[0035]当制导任务改变后,采用新任务的训练数据,对初始网络再训练,获得更新网络,采用更新网络输出飞行器偏置加速度,根据偏置加速度获得飞行器的制导律

[0036]根据本专利技术,所述门控渐进式神经网络,包括一列或多列任务单元,每个任务单元均具有一个输入层

一个或多个隐含层

一个输出层;不同列任务单元之间具有横向连接

[0037]在一个优选的实施方式中,当原始任务的训练数据中包含多种任务时,每种任务对应一列任务单元,多种任务的训练数据依次训练

[0038]优选地,后一列任务单元输入层的输入,包含输入数据以及在其之前所有列任务单元输出层的输出量

[0039]更优选地,后一列任务单元输入层的输入中,为在其之前不同列任务单元输出层的输出量设置有权重参数

[0040]根据本专利技术,所述再训练包括以下步骤:
[0041]在初始网络中增加本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于门控渐进式神经网络的计算制导方法,其特征在于,包括以下步骤:采用原始任务的训练数据,预训练门控渐进式神经网络,获得初始网络,采用初始网络输出飞行器偏置加速度,根据偏置加速度获得飞行器的制导律;当制导任务改变后,采用新任务的训练数据,对初始网络再训练,获得更新网络,采用更新网络输出飞行器偏置加速度,根据偏置加速度获得飞行器的制导律
。2.
根据权利要求1所述的基于门控渐进式神经网络的计算制导方法,其特征在于,所述门控渐进式神经网络,包括一列或多列任务单元,每个列任务单元均具有一个输入层

一个或多个隐含层

一个输出层;不同列任务单元之间具有横向连接
。3.
根据权利要求1所述的基于门控渐进式神经网络的计算制导方法,其特征在于,所述再训练包括以下步骤:在初始网络中增加新列任务单元,在新列任务单元与旧列任务单元之间建立横向连接,形成新的渐进式神经网络;采用新任务的训练数据训练新的渐进式神经网络,获得更新网络
。4.
根据权利要求3所述的基于门控渐进式神经网络的计算制导方法,其特征在于,所述新列任务单元输入层的输入,包含神经网络输入数据以及所有旧...

【专利技术属性】
技术研发人员:何绍溟罗皓文金天宇侯利兵巩庆海
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1