当前位置: 首页 > 专利查询>清华大学专利>正文

一种面向抗干扰的雷达频率捷变方法技术

技术编号:27005345 阅读:53 留言:0更新日期:2021-01-08 17:07
本发明专利技术提出一种面向抗干扰的雷达频率捷变方法,属于频率捷变和雷达抗干扰技术领域。本发明专利技术通过引入长短时记忆网络,利用深度强化学习获得频率捷变策略,使雷达能够综合当前观测和历史观测两方面的信息,自适应切换发射频率以避免干扰,能够同时应对复杂多变的电磁环境和雷达有限观测的问题。使用本发明专利技术中的方法,每部雷达能够通过不断切换频率减小相互间干扰,保证各自正常工作,适应由于相对运动造成的周围电磁环境的迅速变化。

【技术实现步骤摘要】
一种面向抗干扰的雷达频率捷变方法
本专利技术属于频率捷变和雷达抗干扰
,尤其涉及一种面向抗干扰的雷达频率捷变方法。
技术介绍
面对日益复杂的电磁环境,雷达抗干扰能力越来越受到研究人员的关注。雷达抗干扰方法一般可分为两类。一类是被动式,即在接收到干扰之后通过优化接收处理的方法消除或减轻干扰对于目标探测的影响。例如,时域傅里叶变换方法(pre-FFT)是在傅里叶变换之前在时域上将干扰信号置零,频域傅里叶变换方法(post-FFT)是在傅里叶变换之后在频域上将干扰信号出现的频段滤除,自适应波束形成是在空域上去抑制干扰。此外,还有一些在联合域去抑制干扰的方法,例如空时自适应处理等。但这类方法需要获得干扰信号在时、频或空域上的信息才能达到期望的抗干扰效果。另一类是主动式,即雷达通过在时、空、频、码等维度上对发射信号进行选择和设计以达到避免干扰的目的。相比于被动抗干扰技术,主动抗干扰技术在抗干扰效能上具有更大潜力。捷变相参技术被认为是对抗干扰的最有效方式之一,它通过发射波形在时、空、频、码等多个维度快速捷变来避免与其他电磁设备在电磁资源上发生冲突进而减小干扰。频率捷变是捷变相参技术中应用最为广泛的方法之一。但目前频率捷变方式较为单一,往往是随机捷变或者进行人为设计后固定不变,在面对复杂多变的电磁环境时难以发挥频率捷变的抗干扰潜力。在一些研究中,强化学习的方法被引入到雷达频率捷变策略的设计中,使雷达能够根据自身观测自适应地选取发射频率,取得了一定抗干扰效能提升。但是,雷达单次观测到的信息往往较为有限,只依靠雷达单次观测难以获取最优频率捷变策略。现有技术中,雷达频率捷变的方式大多固定单一,并受限于雷达的有限观测,并没有一种雷达频率捷变的方法能同时应对复杂多变的电磁环境和雷达有限观测的问题,导致频率捷变难以发挥其抗干扰的潜力。
技术实现思路
本专利技术的目的是为克服已有技术的不足之处,提出一种面向抗干扰的雷达频率捷变方法。本专利技术使雷达能够综合当前观测和历史观测两方面的信息,自适应切换发射频率以避免干扰,能够同时应对复杂多变的电磁环境和雷达有限观测的问题。本专利技术提出一种面向抗干扰的雷达频率捷变方法,其特征在于,包括以下步骤:(1)初始化;(1-1)构建雷达频率选择估值网络Qeval,表达式如下:qt,ht=Qeval(ot,ht-1;θ)其中,θ为Qeval的网络参数,ot是雷达在t时间步时的观测;在Qeval中,ht-1是雷达对于t-1时间步及以前的记忆向量,qt是t时间步雷达对于各个可选择频率的评估向量,ht是雷达对于t时间步及以前的记忆向量;θ的初始值为随机产生;将初始的估值网络Qeval作为当前估值网络Qeval;(1-2)构建雷达频率选择目标网络Qtarget,表达式如下:其中,Qtarget与Qeval结构相同;在Qtarget中,令t时间步雷达对于各个可选择频率的评估向量记为vt,雷达对于t-1时间步及以前的记忆向量记为gt-1,雷达对于t时间步及以前的记忆向量记为gt;Qtarget的参数为的初始值是独立于θ随机产生的;将初始的目标网络Qtarget作为当前目标网络Qtarget;(1-3)创建一个初始为空的内存D,内存大小为LD;初始化时间步t=1;初始化Qeval的记忆向量h0为全零向量;(2)观测获取;构建t时间步雷达获得的观测:ot=[ft-1,It-1,rt-1,dt,pt],其中,ft-1是雷达在t-1时间步选择的频率对应的索引值,记雷达可选择的频率共有M种,分别以1,2,...,M标记为对应的索引值,即ft-1∈{1,2,...,M};其中,f0为从{1,2,...,M}中随机选择的一个索引值;It-1是雷达在t-1时间步估计的接收干扰功率,令I0=0;rt-1是雷达在t-1时间步抗干扰效能的即时评估,令r0=0;当t≥2时,rt-1的计算表达式如下:其中,是功率阈值;是t时间步雷达对离自身最近的N个目标的距离预测值;pt是雷达自身在t时间步的位置;其中,dt的预测方法如下:若雷达在t-1时间步所受干扰功率小于阈值在t-1时间步,雷达发射信号获得离自身最近的N个目标的距离测量值:以及每个目标在t-1时间步相应的速度测量值:其中,为t-1时间步雷达发射信号获得离自身最近第n个目标的距离测量值;为离雷达最近第n个目标在t-1时间步的速度测量值,1≤n≤N;L0,A0均为全零向量;则t时间步雷达对离自身最近的第n个目标距离预测值为:其中,Δt是相邻两个时间步间的时间间隔;若雷达在t-1时间步所受干扰功率大于等于阈值则t时间步雷达对离自身最近的第n个目标距离预测值为:(3)频率选择与记忆更新;将ot和ht-1输入当前估值网络Qeval:当前估值网络Qeval输出对应的qt和ht,其中:其中,表示雷达在t时间步如果采取频率i将会获得的抗干扰效能的评估值;雷达按照如下方式选择t时间步的频率,得到t时间步的雷达频率捷变结果:其中,ò∈(0,1)是探索概率;(4)经历构建与储存;对t进行判定:若t<2,则令t=t+1,然后重新返回步骤(2);若t≥2,则构建t时间步的经历:et=[ot-1,ht-2,ft-1,rt-1,ot,ht-1],然后将经历et储存到内存D中,令t=t+1,然后重新返回步骤(2);直至当t≥LB+1时,构建t时间步的经历et并将et储存到内存D后,进入步骤5);其中,若t>LD+1时,则将从内存D中移除,构建t时间步的经历et并将et储存到内存D中,然后进入步骤5);LB为设定的训练集的经历数目,1≤LB≤LD;(5)训练集构建;从内存D中随机截取LB个连续经历,构建一个训练集B:其中,τ为该训练集的起始时间步;若LB+1≤t≤LD+1,则τ从[2,t-LB+1]范围内的整数中随机选取;若t>LD,则τ从[2,LD-LB+2]范围内的整数中随机选取;(6)构造代价函数;对于步骤(5)构建的训练集中的每一个经历et∈B,τ≤t≤τ+LB-1,计算对应的目标值yt:其中,γ∈[0,1]是衰减系数;表示通过当前目标网络Qtarget计算的雷达在t时间步如果采取频率i将会获得的抗干扰效能的评估值;的计算方法如下:令初始记忆向量gτ-1=hτ-1,对于每个时间步t,τ≤t≤τ+LB-1,将该时间步对应的观测ot和记忆向量gt-1输入到当前目标网络Qtarget,当前目标网络Qtarget输出t时间步雷达对于各个可选择频率的评估向量vt和雷达对于t时间步及以前的记忆向量gt;其中,构造代价函数:(7)网络参数更新;利用梯度下降对当前估值网络Qeval的网络参数θ进行更新:其中,α∈(0,1)为本文档来自技高网
...

【技术保护点】
1.一种面向抗干扰的雷达频率捷变方法,其特征在于,包括以下步骤:/n(1)初始化;/n(1-1)构建雷达频率选择估值网络Q

【技术特征摘要】
1.一种面向抗干扰的雷达频率捷变方法,其特征在于,包括以下步骤:
(1)初始化;
(1-1)构建雷达频率选择估值网络Qeval,表达式如下:
qt,ht=Qeval(ot,ht-1;θ)
其中,θ为Qeval的网络参数,ot是雷达在t时间步时的观测;在Qeval中,ht-1是雷达对于t-1时间步及以前的记忆向量,qt是t时间步雷达对于各个可选择频率的评估向量,ht是雷达对于t时间步及以前的记忆向量;θ的初始值为随机产生;
将初始的估值网络Qeval作为当前估值网络Qeval;
(1-2)构建雷达频率选择目标网络Qtarget,表达式如下:
vt,
其中,Qtarget与Qeval结构相同;在Qtarget中,令t时间步雷达对于各个可选择频率的评估向量记为vt,雷达对于t-1时间步及以前的记忆向量记为gt-1,雷达对于t时间步及以前的记忆向量记为gt;Qtarget的参数为的初始值是独立于θ随机产生的;
将初始的目标网络Qtarget作为当前目标网络Qtarget;
(1-3)创建一个初始为空的内存D,内存大小为LD;初始化时间步t=1;初始化Qeval的记忆向量h0为全零向量;
(2)观测获取;
构建t时间步雷达获得的观测:
ot=[ft-1,It-1,rt-1,dt,pt],
其中,ft-1是雷达在t-1时间步选择的频率对应的索引值,记雷达可选择的频率共有M种,分别以1,2,...,M标记为对应的索引值,即ft-1∈{1,2,...,M};其中,f0为从{1,2,...,M}中随机选择的一个索引值;It-1是雷达在t-1时间步估计的接收干扰功率,令I0=0;rt-1是雷达在t-1时间步抗干扰效能的即时评估,令r0=0;当t≥2时,rt-1的计算表达式如下:



其中,是功率阈值;

是t时间步雷达对离自身最近的N个目标的距离预测值;pt是雷达自身在t时间步的位置;
其中,dt的预测方法如下:
若雷达在t-1时间步所受干扰功率小于阈值在t-1时间步,雷达发射信号获得离自身最近的N个目标的距离测量值:以及每个目标在t-1时间步相应的速度测量值:其中,为t-1时间步雷达发射信号获得离自身最近第n个目标的距离测量值;为离雷达最近第n个目标在t-1时间步的速度测量值,1≤n≤N;L0,A0均为全零向量;
则t时间步雷达对离自身最近的第n个目标距离预测值为:



其中,Δt是相邻两个时间步间的时间间隔;
若雷达在t-1时间步所受干扰功率大于等于阈值则t时间步雷达对离自身最近的第n个目标距离预测值为:


<...

【专利技术属性】
技术研发人员:刘一民黄天耀王希勤刘鹏飞
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1