一种基于强化学习的捷变频多雷达协同抗干扰方法技术

技术编号:37618688 阅读:42 留言:0更新日期:2023-05-18 12:10
本发明专利技术公开了一种基于强化学习的捷变频多雷达协同抗干扰方法,首先根据相控阵雷达信号处理流程,建立目标回波模型和干扰信号模型,将每个雷达均视为一个智能体,并将雷达协同抗干扰过程建模为广义马尔可夫决策过程,得到状态价值函数,利用提出的并行多智能体Q学习算法求解该问题,最后可以得到雷达载频选择策略。本发明专利技术的方法可以根据干扰当前所在频段,查表选择雷达合适的频段,从而避开干扰下一时刻可能的频段,通过将多雷达协同抗干扰过程建模为广义马尔科夫决策过程,雷达载频视为动作,干扰载频视为状态,SINR作为奖励函数,雷达之间相互合作,降低干扰对单个雷达的干扰程度,有效抑制扫频干扰。有效抑制扫频干扰。有效抑制扫频干扰。

【技术实现步骤摘要】
一种基于强化学习的捷变频多雷达协同抗干扰方法


[0001]本专利技术属于雷达抗干扰
,具体涉及一种基于强化学习的捷变频多雷达协同抗干扰方法。

技术介绍

[0002]捷变频雷达作为一种典型的电子对抗装备,已广泛应用于各种电子对抗场景下中。它通过在脉内、脉间或脉组间快速改变信号载频实现抗干扰,具有探测距离远、测角精度高,抗干扰能力强的特点。扫频干扰作为一种常用的电子对抗技术,通过动态扫描雷达频点来降低雷达分辨率和探测性能。随着干扰能力的增强和认知干扰的发展,捷变频雷达的随机或伪随机跳频策略无法获得有效的抗干扰性能,因此研究一种新的有效的抗干扰技术是未来电子对抗应用的迫切需求。
[0003]为了适应复杂多变的对抗环境,雷达系统需要具备自主学习能力,因此基于强化学习的智能抗干扰技术被提出,雷达通过与外界环境的交互学习干扰策略。将雷达抗干扰过程建模为马尔可夫决策过程(Markov Decision Process,MDP),采用强化学习算法求解最优策略。文献“董淑仙,吴耀君,方文,全英汇.频率捷变雷达联合模糊C均值抗间歇采样干扰.雷达学报,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的捷变频多雷达协同抗干扰方法,具体步骤如下:步骤S1、根据相控阵雷达信号处理流程,建立目标回波模型和干扰信号模型;步骤S2、将每个雷达均视为一个智能体,将雷达协同抗干扰过程建模为广义马尔可夫决策过程,得到状态价值函数;步骤S3、利用并行多智能体Q学习算法求解步骤S2中的广义马尔科夫决策问题,得到雷达载频选择策略。2.根据权利要求1所述的一种基于强化学习的捷变频多雷达协同抗干扰方法,其特征在于,所述步骤S1具体如下:设定雷达系统存在M个雷达节点,任意两个雷达之间的距离与雷达和目标之间的距离相比均忽略不记;每个雷达节点的发射信号在脉间进行载频捷变,一个脉冲串的脉冲数为L;表示雷达节点m(m=1,2,

,M)发射脉冲可选的载频集合;其中,中的第i个元素表示为f
m,i
=f
m,i
‑1+Δf
R
,i∈{2,3,

,N
R
},Δf
R
表示固定的频率步进值,设定与雷达带宽B
R
一样大,N
R
表示雷达脉冲可选载频的数量;且设定任意两个可选载频点之间不重叠,雷达节点m的发射脉冲串信号x
m
(t)表示为:其中,t表示时刻,T
r
表示脉冲重复周期,f
m,n
表示雷达节点m的第n个脉冲的载频,s(t)表示单位幅度的线性调频信号;雷达节点m的发射信号对目标进行照射,产生目标回波,则将雷达节点m在第n个脉冲处受到干扰和噪声影响后的回波信号y
m,n
(t)表示为:其中,τ
q,m,n
=2R
q,m,n
/c表示时延,R
q,m,n
表示雷达节点m与目标在第n个脉冲时的距离,c表示电磁波的传播速度,f
d,q,m,n
表示多普勒频移,N
m,n
(t)表示一个零均值,功率为P
N
的高斯白噪声,J
m,n
(t)表示单位干扰信号,β
m,n
表示干扰信号在空间中传播造成的幅值改变;α
q,m,n
表示一个包含了传播效应以及目标散射的参数,其振幅表示为:其中,P
R,m,n
表示雷达节点m的第n个脉冲在雷达接收机处的接收功率,P
T
表示发射功率,G
T
,G
R
分别表示发射天线增益和接收天线增益,λ表示信号波长,σ表示目标散射截面RCS;设定干扰机采用扫频策略对雷达信号进行干扰,表示干扰信号可选载频集;其中,N
J
表示干扰信号可选的载频数目,中的第p个元素表示为f
J,p
=f
J,p
‑1+Δf
J
,Δf
J
表示固定的干扰频率步进值,干扰载频以随机或者按照一定的策略从中选择,设定干扰的跳频范围能覆盖雷达系统所有可能的频段;设定干扰脉冲和雷达脉冲在时间上是同步的,雷达接收到干扰信号的幅度为:
其中,P
I,m,n
表示雷达接收机处的干扰功率,P
J
表示干扰发射功率,f
J,n
表示干扰载频,G
J
表示干扰发射天线增益,干扰机对雷达节点m的干扰概率U
m,n
为:其中,B
J,n
(f
J,n
)和B
R,m,n
(f
m,n
)分别表示在第n个脉冲时干扰机载频为f
J,n
的中放带宽和雷达节点m载频为f
m,n
的中放带宽;将雷达节点m在第n个脉冲的信干噪比SINR表示为:3.根据权利要求1所述的一种基于强化学习的捷变频多雷达协同抗干扰方法,其特征在于,所述步骤S2具体如下:步骤S21、建立广义马尔科夫决策过程;设定雷达系统中的每...

【专利技术属性】
技术研发人员:崔国龙廖茂森潘步年董露心余显祥方学立张立东孔令讲
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1