一种基于DQN的动态抗主瓣干扰方法技术

技术编号:38483473 阅读:10 留言:0更新日期:2023-08-15 17:00
本发明专利技术公开了一种基于DQN的动态抗主瓣干扰方法,涉及雷达信号处理技术领域,包括:获取回波信号,对回波信号进行采样处理,获取回波信号数据;对回波信号数据取模值,获取回波信号的模值向量;使用训练好的抗主瓣干扰策略选择模型,对回波信号的模值向量进行处理,得到编码向量;根据编码向量,确定训练好的抗主瓣干扰策略选择模型对应的选择动作;根据选择动作,确定对应的抗主瓣干扰策略;其中,每个选择动作对应一种抗主瓣干扰策略。本发明专利技术基于DQN框架,能够根据实际情况对多种抗主瓣干扰策略进行动态的策略选择,避免了单一抗主瓣干扰策略在复杂干扰环境下失效的情况,提高了目标检测概率。测概率。测概率。

【技术实现步骤摘要】
一种基于DQN的动态抗主瓣干扰方法


[0001]本专利技术属于雷达信号处理
,具体涉及一种基于DQN的动态抗主瓣干扰方法。

技术介绍

[0002]在复杂电磁环境中保证生存且完成探测任务,一直是雷达领域关注的重点问题。雷达干扰技术已从最初的噪声阻塞式干扰、放置人为干扰源等简单手段,发展为欺骗式干扰或者多种干扰并存的复杂形式。同时,如果干扰进入雷达的主瓣波束内,也会由于干扰难以去除而影响目标检测的性能。
[0003]相关技术中,一类是对干扰进行处理,估计干扰参数或者进行干扰识别,通过设计滤波器进行干扰滤除;此类方法适合高干信比下的干扰抑制,在低干信比下,由于干扰能量较低,干扰的识别以及干扰参数估计受噪声影响较大,该情况下干扰的参数估计或识别可能有误从而使干扰无法完全滤除。另一类是对目标进行处理,通过保留目标成分或提高目标能量来达到抑制干扰的效果;此类方案适合低干信比下的干扰抑制,此时干扰能量较低,目标成分相对容易获取,提高目标的能量也可以提高目标检测率;但是在高干信比下,强干扰会使目标成分被掩盖,也会使得保留的目标成分存在干扰旁瓣进而影响目标检测。由此可见,单一的策略方案存在较大的局限,方案的有效性容易受到干信比和信噪比等因素的影响,如果未知干信比和信噪比则较难判断采用的策略。在复杂的干扰环境下,单一的抗主瓣干扰策略会导致目标检测性能的下降。
[0004]因此,亟需改善现有技术中存在的上述缺陷。

技术实现思路

[0005]为了解决现有技术中存在的上述问题,本专利技术提供了一种基于DQN的动态抗主瓣干扰方法。本专利技术要解决的技术问题通过以下技术方案实现:
[0006]第一方面,本专利技术提供一种基于DQN的动态抗主瓣干扰方法,包括:
[0007]获取回波信号,对回波信号进行采样处理,获取回波信号数据;
[0008]对回波信号数据取模值,获取回波信号的模值向量;
[0009]使用训练好的抗主瓣干扰策略选择模型,对回波信号的模值向量进行处理,得到编码向量;
[0010]根据编码向量,确定训练好的抗主瓣干扰策略选择模型对应的选择动作;
[0011]根据选择动作,确定对应的抗主瓣干扰策略;其中,每个选择动作对应一种抗主瓣干扰策略。
[0012]本专利技术的有益效果:
[0013]本专利技术提供的一种基于DQN的动态抗主瓣干扰方法,根据信噪比和干信比,将回波信号生成回波信号数据模值向量;根据回波信号数据模值向量,获取编码向量;根据编码向量,获取与编码向量对应的选择动作;如此,能够根据实际情况对多种抗主瓣干扰策略进行
策略选择,避免了单一抗主瓣干扰策略在复杂干扰环境下失效的情况,提高了目标检测概率。
[0014]以下将结合附图及实施例对本专利技术做进一步详细说明。
附图说明
[0015]图1是本专利技术实施例提供的基于DQN的动态抗主瓣干扰方法的一种流程图;
[0016]图2是本专利技术实施例提供的决策网络模块的一种结构示意图;
[0017]图3是本专利技术实施例提供的检测概率矩阵的一种示意图。
具体实施方式
[0018]下面结合具体实施例对本专利技术做进一步详细的描述,但本专利技术的实施方式不限于此。
[0019]现有技术中,DRFM(Digital Radio Frequency Memory,数字射频存储器)干扰机通常用来产生欺骗干扰,干扰类型包括全脉冲存储转发、间歇采样存储转发和带卷积调制的间歇采样存储转发;其中,间歇采样存储转发干扰主要包括三种:重复存储转发干扰ISRJ(Interrupted Sampling And Repeater Jamming),直接存储转发干扰ISDJ(Interrupted Sampling And Direct Jamming)和循环存储转发干扰ISCJ(Intermittent Sampling And Cyclic Jamming)。其中,ISRJ将发射信号采样后进行重复转发,再采样下一段,该干扰模式会产生多个主假目标,但由于干扰段相同,与目标的相关性相对较弱;ISDJ将发射信号采样后进行直接转发,该干扰模式会产生单个主假目标和多个副假目标,由于转发的干扰段包含的目标不同,与目标具有较强的相关性;ISCJ在转发当前采样的信号切片后,还会逆序地将前面采样的信号切片进行转发,同时在雷达脉冲结束后,还需继续转发此前采样的信号段,直到所有采样信号达到相同的转发次数为止,此类型干扰会形成多个主假目标和副假目标。带卷积调制的间歇采样转发干扰是在间歇采样转发干扰的基础上叠加卷积噪声,该方式得到的干扰信号既具有间歇采样干扰的强欺骗性,又具有噪声干扰的强压制性,做完脉冲压缩后会在大范围内形成能量高点,大范围内的多个间隙采样干扰将会淹没目标,使雷达不能有效地滤除干扰,检测出目标位置。同时,如果干扰进入雷达的主瓣波束内,此时干扰将获得雷达的主瓣增益,无法用旁瓣相消或旁瓣匿影等方法进行干扰滤除,这将对目标的检测造成极大的影响。
[0020]有鉴于此,本专利技术提供一种基于DQN的动态抗主瓣干扰方法,根据实际情况,对多种抗主瓣干扰策略进行策略性选择,能够有效避免单一抗主瓣干扰策略在复杂干扰环境下失效的情况,提高目标检测率。
[0021]请参见图1所示,图1是本专利技术实施例提供的基于DQN的动态抗主瓣干扰方法的一种流程图,本专利技术所提供的一种基于DQN的动态抗主瓣干扰方法,包括:
[0022]S101、获取回波信号,对回波信号进行采样处理,获取回波信号数据。
[0023]具体而言,本实施例中,首先,获取回波信号;其次,按照预设的采样时间间隔和预设的采样点数,对回波信号进行采样处理,获取离散后的回波信号数据,其表达式为:
[0024][0025]其中,N
L
为回波信号的预设的采样点,x
l
为第l个采样单元的回波信号数据。
[0026]S102、对回波信号数据取模值,获取回波信号的模值向量。
[0027]具体而言,本实施例中,对获取的回波信号数据取模值,获取回波信号的模值向量|x|。
[0028]其中,构建动作空间A和状态空间S;其中,动作空间包括多个动作a
t
,每个动作a
t
对应一种抗主瓣干扰策略;状态空间S包括多个状态s
t
,状态s
t
包括信噪比和干信比。
[0029]本实施例中,对获取的回波信号数据获取模值,获取回波信号的模值|x|,再进一步获取回波信号的模值向量|x|,具体为:
[0030]通过状态生成模块,获取回波信号的模值|x|,输入为信噪比SNR和干信比JSR,输出回波信号的模值|x|,其表达式为:
[0031]|x|=f(SNR,JSR)=|x
t
+x
j
+n|;
[0032]x
t
=f
t
(s,d
t
);
[0033]x本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于DQN的动态抗主瓣干扰方法,其特征在于,包括:获取回波信号,对所述回波信号进行采样处理,获取回波信号数据;对所述回波信号数据取模值,获取回波信号的模值向量;使用训练好的抗主瓣干扰策略选择模型,对所述回波信号的模值向量进行处理,得到编码向量;根据所述编码向量,确定所述训练好的抗主瓣干扰策略选择模型对应的选择动作;根据所述选择动作,确定对应的抗主瓣干扰策略;其中,每个所述选择动作对应一种所述抗主瓣干扰策略。2.根据权利要求1所述的基于DQN的动态抗主瓣干扰方法,其特征在于,还包括:构建动作空间A和状态空间S;其中,所述动作空间包括多个动作a
t
,每个所述动作a
t
对应一种抗主瓣干扰策略;状态空间S包括多个状态s
t
,所述状态s
t
包括信噪比和干信比。3.根据权利要求2所述的基于DQN的动态抗主瓣干扰方法,其特征在于,所述训练好的抗主瓣干扰策略选择模型的构建过程包括:获取训练样本集,所述训练样本集包括多个不同信噪比、不同干信比和干扰距离随机的回波信号的模值向量样本;初始化待训练的神经网络的网络参数;将所述训练样本集输入至所述待训练的神经网络,使所述待训练的神经网络根据所述回波信号的模值向量样本得到选择动作;预设损失函数,根据所述选择动作和所述预设损失函数,获取损失值;判断所述损失值是否小于等于预设阈值,如果否,则更新所述待训练的神经网络的网络参数,并将所述训练样本集输入至更新网络参数的待训练的神经网络再处理;如果是,则获取所述待训练的神经网络的网络参数,构建所述训练好的抗主瓣干扰策略选择模型。4.根据权利要求3所述的基于DQN的动态抗主瓣干扰方法,其特征在于,所述损失值的获取过程包括:根据所述回波信号的模值向量样本对应的所述状态s
t
,获取所述动作a
t
对应的Q值,并选择Q值最大的方案,并将其作为选择动作a
t
;其中,所述动作包括至少两个方案;根据所述动作对应的Q值,获取TD target的预测值,其表达式为:其中,y
t
为TD target的预测值,r
t
为回报值,即动作a
t
、状态s
t
下的检测概率Pd(SNR,JSR,a
t
),γ为学习率,a
t
为动作,w为神经网络参数,s
t+1
为下一时刻的状态;预设损失函数,根据所述TD target预测值,获取所述损失值,所述预设损失函数的表达式为:其中,L为损失值,Q(s
t
,a
t
;w)为所述待训练的神经网络的网络参数w
t
下,对应动作a
t
、状态s
t
的Q值。5.根据权利要求4所述的基于DQN的动态抗主瓣干扰方法,其特征在于,所述根据所述
回波信号数据模值向量样本对应的所述状态s
t
,获取所述动作对应的Q值,并选择Q值最大的方...

【专利技术属性】
技术研发人员:纠博徐丹蕾刘若帆张钰刘宏伟
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1