【技术实现步骤摘要】
一种多弹时间协同的导弹制导方法及系统
[0001]本专利技术属于导弹制导
,特别涉及一种多弹时间协同的导弹制导方法及系统。
技术介绍
[0002]过去几十年,经典比例导引律(proportional navigation guidance,PNG)因其实现简单、制导效果良好,在工程中获得了广泛应用及深入研究。随着导弹防御系统尤其是突防系统的发展,导弹制导作战出现了许多新的模式;例如,多导弹齐射攻击可以有效提高单枚进攻导弹生存概率,从而完成预定作战任务。多导弹齐射攻击是指多枚导弹在同一时刻攻击同一目标,相较单枚导弹作战,可以大幅度提高对目标的毁伤效率。
[0003]实现多导弹齐射攻击的主要方法是对导弹碰撞时间进行控制,使多弹碰撞时间趋于一致,实现同时攻击。关于碰撞时间控制,Jeon等人首次基于线性化制导模型及最优控制理论推导出一种碰撞时间控制制导律(impact
‑
time
‑
control
‑
guidance,ITCG),ITCG可以导引一组导弹同时攻击一个静止目标。进一步地,Cho等人基于导弹剩余飞行时间估计信息得到非线性制导模型下制导律的解析解。Dongso等人针对静止目标,基于非奇异滑模控制实现对碰撞时间控制,且避免了制导律的奇异解,利用预测拦截点概念,所提制导律可以容易扩展到非机动目标。赵等人提出一种三维时间协同制导律(cooperative PNG,CPN),该制导律由两部分组成,一部分用于向目标寻的制导(即PNG),另一部分用于消除弹群剩 ...
【技术保护点】
【技术特征摘要】
1.一种多弹时间协同的导弹制导方法,其特征在于,包括以下步骤:(1)建立弹群中每枚导弹的制导运动学模型;(2)针对建立的每枚导弹的制导运动学模型,分别给出针对静止目标及机动目标下的CPN制导律,基于CPN制导律完成导弹制导;其中,所述CPN制导律确定时,基于加权平均一致性方法计算弹群一致性期望剩余飞行时间;基于多智能体深度确定性策略梯度算法,使导弹学习决策CPN制导律相关系数。2.根据权利要求1所述的一种多弹时间协同的导弹制导方法,其特征在于,步骤(1)中,所述制导运动学模型是指弹
‑
目相对运动学方程,表达式为,式中,r表示弹目距离大小,表示弹目视线角变化率,a
x
、V
x
、γ
x
及θ
x
分别表示加速度、速度、速度航向角及速度航向角误差,x取m表示导弹相关量,取t表示目标相关量。3.根据权利要求2所述的一种多弹时间协同的导弹制导方法,其特征在于,步骤(2)中,所述基于建立的制导运动学模型,分别给出针对静止目标及机动目标下的CPN的步骤具体包括:假设n枚导弹参与针对静止目标的协同攻击,则CPN制导指令如下:a
ci
=a
PNGi
+a
ki i=1,2,3,
…
,n,式中,N
i
为导航比例系数,k
i
为比例增益系数,t
goi
(t)为导弹i期望剩余飞行时间,a
ci
为CPN制导加速度,a
PNGi
为a
ci
的第一项,用于向目标寻的制导,a
ki
为a
ci
的第二项,用于消除弹群剩余飞行时间之差,为剩余飞行时间的估计,假设n枚导弹参与针对机动目标的协同攻击,则CPN制导指令如下:a
ci
=a
PNGi
+a
ki i=1,2,3,
…
,n,
式中,η
i
为导弹i速度航向角与目标速度航向角之差。4.根据权利要求3所述的一种多弹时间协同的导弹制导方法,其特征在于,步骤(2)中,所述基于加权平均一致性方法计算弹群一致性期望剩余飞行时间的具体步骤包括:建立分布式通信网络,使用无向图G=(V,ε)表示通信网络拓扑;其中,顶点集合V={1,2,3,
…
,n}表示通信节点,边集合ε∈V
×
V表示节点之间的信道;称所有能够与节点i通信的节点j为节点i邻近节点集称经过节点i边的个数为节点i的度d
i
;在通信拓扑图完全连通下,应用加权一致性方法的t
goi
(t)计算表达式为,式中,t
goi,l
(t)为计算t
goi
(t)的迭代中间量,l为一致性迭代步数,u
i,j
为一致性加权系数;5.根据权利要求4所述的一种多弹时间协同的导弹制导方法,其特征在于,应用加权一致性方法计算t
goi
(t)时,l取值为L,满足:式中,为弹群全局期望剩余飞行时间。6.根据权利要求4所述的一种多弹时间协同的导弹制导方法,其特征在于,步骤(2)中,所述基于多智能体深度确定性策略梯度算法,使导弹学习决策CPN制导律相关系数的具体步骤包括:(2.1)导弹i环境状态空间设计,包括:在导弹i学习决策CPN制导律相关系数k
i
时,选取为导弹i环境状态,选取弹目距离r
i
及视线角λ
i
为环境状态,学习任务的状态为(2.2)导弹i动作空间设计,包括:导弹i动作值为CPN相关系数k
i
,在时间协同制导律CPN基础上应用深度强化学习方法学习其相关系数k
i
;(2.3)导弹i即时奖励函数设计,包括:对于导弹i,建立如下奖励函数:
式中,为弹目距离变化率,其由负变正时刻为导弹i本次学习回合结束时刻;a
i
及b
i
分别为制导精度指标及时间协同误差指标权重系数,满足a
i
+b
i
=1;导弹i飞行时,若导弹当前时刻动作使得下一时刻弹目距离减小,则获得一个正奖励,若使得下一时刻协同时间误差减小,则也获得一个正奖励;调整a
i
及b
i
的值,用于调整制导精度及时间协同误差指标在学习目标中的重要性;r
hit
及ξ分别为脱靶及时间协同误差阈值;导弹i飞行结束时,若制导精度及时间协同误差均满足要求,则给予足够大的正奖励;其中,所述足够大的正奖励满足...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。