一种多弹时间协同的导弹制导方法及系统技术方案

技术编号:28746161 阅读:29 留言:0更新日期:2021-06-06 18:45
本发明专利技术公开了一种多弹时间协同的导弹制导方法及系统,所述方法包括以下步骤:(1)建立弹群中每枚导弹的制导运动学模型;(2)针对建立的每枚导弹的制导运动学模型,分别给出针对静止目标及机动目标下的CPN制导律,基于CPN制导律完成导弹制导;其中,所述CPN制导律确定时,基于加权平均一致性方法计算弹群一致性期望剩余飞行时间;基于多智能体深度确定性策略梯度算法,使导弹学习决策CPN制导律相关系数。本发明专利技术在现有时间协同制导律CPN基础上应用多智能体DRL赋予导弹群智能感知与决策能力,能够提升制导精度,降低协同时间误差,可分别针对静止及机动目标实现有效攻击。对静止及机动目标实现有效攻击。对静止及机动目标实现有效攻击。

【技术实现步骤摘要】
一种多弹时间协同的导弹制导方法及系统


[0001]本专利技术属于导弹制导
,特别涉及一种多弹时间协同的导弹制导方法及系统。

技术介绍

[0002]过去几十年,经典比例导引律(proportional navigation guidance,PNG)因其实现简单、制导效果良好,在工程中获得了广泛应用及深入研究。随着导弹防御系统尤其是突防系统的发展,导弹制导作战出现了许多新的模式;例如,多导弹齐射攻击可以有效提高单枚进攻导弹生存概率,从而完成预定作战任务。多导弹齐射攻击是指多枚导弹在同一时刻攻击同一目标,相较单枚导弹作战,可以大幅度提高对目标的毁伤效率。
[0003]实现多导弹齐射攻击的主要方法是对导弹碰撞时间进行控制,使多弹碰撞时间趋于一致,实现同时攻击。关于碰撞时间控制,Jeon等人首次基于线性化制导模型及最优控制理论推导出一种碰撞时间控制制导律(impact

time

control

guidance,ITCG),ITCG可以导引一组导弹同时攻击一个静止目标。进一步地,Cho等人基于导弹剩余飞行时间估计信息得到非线性制导模型下制导律的解析解。Dongso等人针对静止目标,基于非奇异滑模控制实现对碰撞时间控制,且避免了制导律的奇异解,利用预测拦截点概念,所提制导律可以容易扩展到非机动目标。赵等人提出一种三维时间协同制导律(cooperative PNG,CPN),该制导律由两部分组成,一部分用于向目标寻的制导(即PNG),另一部分用于消除弹群剩余飞行时间之间误差,所提制导律可导引多弹齐射攻击静止目标和机动目标。
[0004]现有时间协同制导律多为在PNG基础上,应用高级控制理论,诸如反馈线性化、最优控制、滑模控制等,对碰撞时间进行控制,并未考虑智能感知、智能决策等问题。
[0005]深度强化学习(deep reinforcement learning,DRL)作为强化学习(reinforcement learning,RL)与深度学习(deep learning,DL)结合产物,既具有RL智能决策能力,又具有DL的智能感知能力。因此将DRL应用于导弹制导领域可为导弹赋予智能感知与决策能力,使导弹充分发挥自身机动能力,改善作战效果。张秦浩等人提出基于Q强化学习制导律,所提算法相较PNG有更高制导精度,且赋予导弹自主决策能力。Vitaly等人基于DRL提出一种在线估计突防弹最优发射时间方法及一种拦截弹最优制导律,应用于拦截弹与突防弹的智能攻防对抗。南英等人基于DRL,提出一种完全数据驱动的弹道导弹中段突防控制模型,实现了对中段突防最优控制模型的逼近。
[0006]综上所述,现有时间协同制导算法及DRL在制导领域中的应用主要存在以下两点不足:
[0007](1)现有时间协同制导律多为PNG与高级控制理论结合产物,并未从智能感知、决策角度考虑,且大多针对静止目标;
[0008](2)当前DRL在导弹制导领域中多应用于单枚导弹制导精度提升及拦截弹与突防弹攻防对抗上,还未应用于多弹时间协同制导。

技术实现思路

[0009]本专利技术的目的在于提供一种多弹时间协同的导弹制导方法及系统,以解决上述存在的一个或多个技术问题。本专利技术的智能多导弹时间协同制导方法,在现有时间协同制导律CPN基础上应用多智能体DRL赋予导弹群智能感知与决策能力,能够提升制导精度,降低协同时间误差,可分别针对静止及机动目标实现有效攻击。
[0010]为达到上述目的,本专利技术采用以下技术方案:
[0011]本专利技术的一种多弹时间协同的导弹制导方法,包括以下步骤:
[0012](1)建立弹群中每枚导弹的制导运动学模型;
[0013](2)针对建立的每枚导弹的制导运动学模型,分别给出针对静止目标及机动目标下的CPN制导律,基于CPN制导律完成导弹制导;其中,所述CPN制导律确定时,基于加权平均一致性方法计算弹群一致性期望剩余飞行时间;基于多智能体深度确定性策略梯度算法,使导弹学习决策CPN制导律相关系数。
[0014]本专利技术的进一步改进在于,步骤(1)中,所述制导运动学模型是指弹

目相对运动学方程,表达式为,
[0015][0016]式中,r表示弹目距离大小,表示弹目视线角变化率,a
x
、V
x
、γ
x
及θ
x
分别表示加速度、速度、速度航向角及速度航向角误差,x取m表示导弹相关量,取t表示目标相关量。
[0017]本专利技术的进一步改进在于,步骤(2)中,所述基于建立的制导运动学模型,分别给出针对静止目标及机动目标下的CPN的步骤具体包括:
[0018]假设n枚导弹参与针对静止目标的协同攻击,则CPN制导指令如下:
[0019]a
ci
=a
PNGi
+a
ki i=1,2,3,

,n,
[0020][0021]式中,N
i
为导航比例系数,k
i
为比例增益系数,t
goi
(t)为导弹i期望剩余飞行时间,a
ci
为CPN制导加速度,a
PNGi
为a
ci
的第一项,用于向目标寻的制导,a
ki
为a
ci
的第二项,用于消除弹群剩余飞行时间之差,为剩余飞行时间的估计,
[0022]假设n枚导弹参与针对机动目标的协同攻击,则CPN制导指令如下:
[0023]a
ci
=a
PNGi
+a
ki i=1,2,3,

,n,
[0024][0025][0026]式中,η
i
为导弹i速度航向角与目标速度航向角之差。
[0027]本专利技术的进一步改进在于,步骤(2)中,所述基于加权平均一致性方法计算弹群一致性期望剩余飞行时间的具体步骤包括:
[0028]建立分布式通信网络,使用无向图G=(V,ε)表示通信网络拓扑;其中,顶点集合V={1,2,3,

,n}表示通信节点,边集合ε∈V
×
V表示节点之间的信道;称所有能够与节点i通信的节点j为节点i邻近节点集称经过节点i边的个数为节点i的度d
i

[0029]在通信拓扑图完全连通下,应用加权一致性方法的t
goi
(t)计算表达式为,
[0030][0031]式中,t
goi,l
(t)为计算t
goi
(t)的迭代中间量,l为一致性迭代步数,u
i,j
为一致性加权系数;
[0032][0033]本专利技术的进一步改进在于,应用加权一致性方法计算t
goi
(t)时,l取值为L,满足:
[0034][0035]式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多弹时间协同的导弹制导方法,其特征在于,包括以下步骤:(1)建立弹群中每枚导弹的制导运动学模型;(2)针对建立的每枚导弹的制导运动学模型,分别给出针对静止目标及机动目标下的CPN制导律,基于CPN制导律完成导弹制导;其中,所述CPN制导律确定时,基于加权平均一致性方法计算弹群一致性期望剩余飞行时间;基于多智能体深度确定性策略梯度算法,使导弹学习决策CPN制导律相关系数。2.根据权利要求1所述的一种多弹时间协同的导弹制导方法,其特征在于,步骤(1)中,所述制导运动学模型是指弹

目相对运动学方程,表达式为,式中,r表示弹目距离大小,表示弹目视线角变化率,a
x
、V
x
、γ
x
及θ
x
分别表示加速度、速度、速度航向角及速度航向角误差,x取m表示导弹相关量,取t表示目标相关量。3.根据权利要求2所述的一种多弹时间协同的导弹制导方法,其特征在于,步骤(2)中,所述基于建立的制导运动学模型,分别给出针对静止目标及机动目标下的CPN的步骤具体包括:假设n枚导弹参与针对静止目标的协同攻击,则CPN制导指令如下:a
ci
=a
PNGi
+a
ki i=1,2,3,

,n,式中,N
i
为导航比例系数,k
i
为比例增益系数,t
goi
(t)为导弹i期望剩余飞行时间,a
ci
为CPN制导加速度,a
PNGi
为a
ci
的第一项,用于向目标寻的制导,a
ki
为a
ci
的第二项,用于消除弹群剩余飞行时间之差,为剩余飞行时间的估计,假设n枚导弹参与针对机动目标的协同攻击,则CPN制导指令如下:a
ci
=a
PNGi
+a
ki i=1,2,3,

,n,
式中,η
i
为导弹i速度航向角与目标速度航向角之差。4.根据权利要求3所述的一种多弹时间协同的导弹制导方法,其特征在于,步骤(2)中,所述基于加权平均一致性方法计算弹群一致性期望剩余飞行时间的具体步骤包括:建立分布式通信网络,使用无向图G=(V,ε)表示通信网络拓扑;其中,顶点集合V={1,2,3,

,n}表示通信节点,边集合ε∈V
×
V表示节点之间的信道;称所有能够与节点i通信的节点j为节点i邻近节点集称经过节点i边的个数为节点i的度d
i
;在通信拓扑图完全连通下,应用加权一致性方法的t
goi
(t)计算表达式为,式中,t
goi,l
(t)为计算t
goi
(t)的迭代中间量,l为一致性迭代步数,u
i,j
为一致性加权系数;5.根据权利要求4所述的一种多弹时间协同的导弹制导方法,其特征在于,应用加权一致性方法计算t
goi
(t)时,l取值为L,满足:式中,为弹群全局期望剩余飞行时间。6.根据权利要求4所述的一种多弹时间协同的导弹制导方法,其特征在于,步骤(2)中,所述基于多智能体深度确定性策略梯度算法,使导弹学习决策CPN制导律相关系数的具体步骤包括:(2.1)导弹i环境状态空间设计,包括:在导弹i学习决策CPN制导律相关系数k
i
时,选取为导弹i环境状态,选取弹目距离r
i
及视线角λ
i
为环境状态,学习任务的状态为(2.2)导弹i动作空间设计,包括:导弹i动作值为CPN相关系数k
i
,在时间协同制导律CPN基础上应用深度强化学习方法学习其相关系数k
i
;(2.3)导弹i即时奖励函数设计,包括:对于导弹i,建立如下奖励函数:
式中,为弹目距离变化率,其由负变正时刻为导弹i本次学习回合结束时刻;a
i
及b
i
分别为制导精度指标及时间协同误差指标权重系数,满足a
i
+b
i
=1;导弹i飞行时,若导弹当前时刻动作使得下一时刻弹目距离减小,则获得一个正奖励,若使得下一时刻协同时间误差减小,则也获得一个正奖励;调整a
i
及b
i
的值,用于调整制导精度及时间协同误差指标在学习目标中的重要性;r
hit
及ξ分别为脱靶及时间协同误差阈值;导弹i飞行结束时,若制导精度及时间协同误差均满足要求,则给予足够大的正奖励;其中,所述足够大的正奖励满足...

【专利技术属性】
技术研发人员:蔡远利闫明明
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1