一种时间一致性协同制导方法、系统、设备及介质技术方案

技术编号:38206847 阅读:11 留言:0更新日期:2023-07-21 16:54
本发明专利技术公开一种时间一致性协同制导方法、系统、设备及介质,属于导弹制导与控制领域。本发明专利技术加入增量学习的训练方法,使得在原有预测模型的基础上,神经网络的预测精度能够进一步提升;利用增量学习神经网络预测剩余飞行时间,能够获得更高精度的剩余飞行时间;结合增量学习神经网络预测的剩余飞行时间和导弹目标相对运动方程,构建时间一致性协同制导律,进而利用时间一致性协同制导律对所有导弹进行协同制导,使得所有导弹同时击中目标,降低了对初始阵位的要求,提升了协同制导效能,降低了对弹上各硬件设施的要求,提高了系统的自主性能。主性能。主性能。

【技术实现步骤摘要】
一种时间一致性协同制导方法、系统、设备及介质


[0001]本专利技术涉及导弹制导与控制领域,特别是涉及一种时间一致性协同制导方法、系统、设备及介质。

技术介绍

[0002]在现代化的战争中,攻击敌方目标的任务较为复杂,单个导弹很难完成打击任务,或者所需成本过大。因此在上述场景中,往往需要多个导弹进行协同打击。利用多个导弹协同打击能够降低攻击所需成本,提高命中毁伤值。
[0003]现有协同制导律的传统研究方法较为成熟;关于神经网络等智能算法方面的研究中,在训练样本和训练方式选择优良的情况下,算法能够发挥出比传统方法更优秀的性能,但缺乏应用场景的普适性。
[0004]一般的机器学习模型(尤其是基于反向传播的机器学习方法)在新任务上训练时,在旧任务上的表现通常会显著下降。解决灾难性遗忘最简单粗暴的方案就是使用所有已知的数据重新训练网络参数,以适应数据分布随时间的变化。尽管从头训练模型的确完全解决了灾难性遗忘问题,但这种方法效率非常低,极大地阻碍了模型实时地学习新数据。
[0005]在进行协同的过程中,现有方法对于初始阵位的要求较高,所以需要更好的协同制导方法,来提高时间协同方法对于初始阵位的普适性,以提升协同效能。

技术实现思路

[0006]本专利技术的目的是提供一种时间一致性协同制导方法、系统、设备及介质,可提升协同制导效能,降低对弹上各硬件设施的要求,提高系统的自主性能。
[0007]为实现上述目的,本专利技术提供了如下方案:
[0008]一种时间一致性协同制导方法,包括:
[0009]建立多弹制导几何以及导弹目标相对运动方程;
[0010]根据多弹制导几何对各导弹和打击目标建模,经过数值仿真获得训练数据集;所述训练数据集的输入为各导弹的状态信息,标签为各导弹的剩余飞行时间;
[0011]构造BP神经网络模型,并采用所述训练数据集训练BP神经网络模型,获得训练好的BP神经网络模型;
[0012]获取新的训练数据集,同时采用增量学习方法,对训练好的BP神经网络模型进行二次训练,得到增量学习训练后的BP神经网络模型;
[0013]对增量学习训练后的BP神经网络模型进行优化,获得用于预测剩余飞行时间的增量学习神经网络;
[0014]结合所述增量学习神经网络预测的剩余飞行时间和所述导弹目标相对运动方程,构建时间一致性协同制导律;
[0015]利用所述时间一致性协同制导律对所有导弹进行协同制导,使得所有导弹同时击中目标。
[0016]可选地,所述导弹目标相对运动方程为
[0017][0018]式中,r
i
为导弹M
i
到目标T的距离,为r
i
的一阶导,V
t
为t时刻的目标速度,V
mi
为导弹M
i
的速度,η
t
为目标T的前置角,η
mi
为导弹M
i
的前置角,q
i
为导弹M
i
相对于目标T的视线角,为q
i
的一阶导,η
ti
为t时刻目标T相对于导弹M
i
的前置角,σ
mi
为导弹M
i
的航向角,σ
t
为t时刻目标T的航向角,K为导航比。
[0019]可选地,所述BP神经网络模型包括依次连接的1个输入层、3个隐含层和1个输出层;
[0020]输入层包括8个特征节点,8个特征节点分别为导弹M
i
到目标T的距离r
i
、导弹M
i
的速度V
i
、横向平面上的视线角q
ilat
、纵向平面上的视线角q
ilon
、导弹M
i
的弹道偏角σ
milat
、导弹M
i
的弹道倾角σ
milon
、目标T的弹道偏角σ
tlat
和目标T的弹道倾角σ
tlon

[0021]3个隐含层的特征节点个数依次为8、4、2;
[0022]输出层的节点个数为1。
[0023]可选地,采用反向传播梯度下降算法训练BP神经网络模型,并在第一个隐含层和第三个隐含层采用tansig激活函数,输入层、第二个隐含层和输出层采用purelin激活函数,purelin为线性函数,输入和输出相等;
[0024]训练好的BP神经网络模型预测剩余飞行时间的表达式为:其中,为导弹M
i
的剩余飞行时间,f(
·
)为训练好的BP神经网络模型,v
bp
为训练好的BP神经网络模型的参数,x
i
为输入量,x
i
=[r
i
,V
i
,q
ilat
,q
ilon

milat

milon

tlat

tlon
]。
[0025]可选地,所述增量学习神经网络预测剩余飞行时间的表达式为
[0026][0027]其中,f

(
·
)为增量学习神经网络,v
best
为最优参数,v
best
=α
·
v
bp
+(1

α)
·
v
incre
,α为增量学习率,v
incre
为增量学习神经网络的参数。
[0028]可选地,所述时间一致性协同制导律的表达式为
[0029][0030]式中,a
i
表示导弹M
i
的法向过载,N
i
为有效导航比,为中间变量,a
t
为目标法向加速度,K
i
为调节系数,为所有导弹的剩余飞行时间的最大值。
[0031]一种时间一致性协同制导系统,包括:
[0032]几何建立模块,用于建立多弹制导几何以及导弹目标相对运动方程;
[0033]仿真模块,用于根据多弹制导几何对各导弹和打击目标建模,经过数值仿真获得训练数据集;所述训练数据集的输入为各导弹的状态信息,标签为各导弹的剩余飞行时间;
[0034]一次训练模块,用于构造BP神经网络模型,并采用所述训练数据集训练BP神经网络模型,获得训练好的BP神经网络模型;
[0035]二次训练模块,用于获取新的训练数据集,同时采用增量学习方法,对训练好的BP神经网络模型进行二次训练,得到增量学习训练后的BP神经网络模型;
[0036]优化模块,用于对增量学习训练后的BP神经网络模型进行优化,获得用于预测剩余飞行时间的增量学习神经网络;
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种时间一致性协同制导方法,其特征在于,包括:建立多弹制导几何以及导弹目标相对运动方程;根据多弹制导几何对各导弹和打击目标建模,经过数值仿真获得训练数据集;所述训练数据集的输入为各导弹的状态信息,标签为各导弹的剩余飞行时间;构造BP神经网络模型,并采用所述训练数据集训练BP神经网络模型,获得训练好的BP神经网络模型;获取新的训练数据集,同时采用增量学习方法,对训练好的BP神经网络模型进行二次训练,得到增量学习训练后的BP神经网络模型;对增量学习训练后的BP神经网络模型进行优化,获得用于预测剩余飞行时间的增量学习神经网络;结合所述增量学习神经网络预测的剩余飞行时间和所述导弹目标相对运动方程,构建时间一致性协同制导律;利用所述时间一致性协同制导律对所有导弹进行协同制导,使得所有导弹同时击中目标。2.根据权利要求1所述的时间一致性协同制导方法,其特征在于,所述导弹目标相对运动方程为式中,r
i
为导弹M
i
到目标T的距离,为r
i
的一阶导,V
t
为t时刻的目标速度,V
mi
为导弹M
i
的速度,η
mi
为导弹M
i
的前置角,q
i
为导弹M
i
相对于目标T的视线角,为q
i
的一阶导,η
ti
为t时刻目标T相对于导弹M
i
的前置角,σ
mi
为导弹M
i
的航向角,σ
t
为t时刻目标T的航向角,K为导航比。3.根据权利要求2所述的时间一致性协同制导方法,其特征在于,所述BP神经网络模型包括依次连接的1个输入层、3个隐含层和1个输出层;输入层包括8个特征节点,8个特征节点分别为导弹M
i
到目标T的距离r
i
、导弹M
i
的速度V
i
、横向平面上的视线角q
ilat
、纵向平面上的视线角q
ilon
、导弹M
i
的弹道偏角σ
milat
、导弹M
i
的弹道倾角σ
milon
、目标T的弹道偏角σ
tlat
和目标T的弹道倾角σ
tlon
;3个隐含层的特征节点个数依次为8、4、2;输出层的节点个数为1。4.根据权利要求3所述的时间一致性协同制导方法,其特征在于,采用反向传播梯度下降算法训练BP神经网络模型,并在第一个隐含层和第三个隐含层采用tansig激活函数,输入层、第二个隐含层和输出层采用purelin激活函数;所述purelin激活函数为线性函数,输入和输出相等;训练好的BP神经网络模型预测剩余飞行时间的表达式为:其中,为
...

【专利技术属性】
技术研发人员:于江龙李旭恒董希旺化永朝孙超李晓多任章
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1