【技术实现步骤摘要】
基于多准则多代价函数的雷达智能抗干扰决策方法
[0001]本专利技术涉及基于多准则多代价函数的雷达智能抗干扰决策方法,属于雷达抗干扰
。
技术介绍
[0002]在雷达与电子干扰的博弈中,干扰方会不断改变干扰策略,产生更加复杂和不可预测的干扰类型
。
这给雷达的抗干扰能力带来了严重的威胁和挑战
。
[0003]在雷达抗干扰的过程中,准确的抗干扰决策是有效对抗的重要前提
。
当雷达面临简单干扰时,基于模板匹配的抗干扰决策方法是有效的
。
当雷达的知识库抗干扰措施数量较少时,采用多属性决策方法或模糊层次分析法也可以解决抗干扰决策问题
。
然而,随着干扰技术的快速发展,雷达抗干扰措施的类型也越来越多
。
传统的决策方法不能满足认知雷达智能抗干扰的需要
。
强化学习
(reinforcement learning,RL)
主要用于解决序列决策问题,
RL
的思想与智能雷达抗干扰
【技术保护点】
【技术特征摘要】
1.
一种基于多准则多代价函数的雷达智能抗干扰决策方法,其特征在于包括,对每种干扰模式,设定对应的评价指标;根据评价指标计算不同抗干扰措施对抗不同干扰模式下不同干扰类型的抗干扰提升因子,再基于抗干扰提升因子获得干扰与抗干扰的相关矩阵;基于干扰与抗干扰的相关矩阵设计代价函数:代价函数一,以最大化所有抗干扰措施的抗干扰提升因子累加和的平均值为决策目标;代价函数二,以最小化选择抗干扰措施的数量为目标;根据雷达抗干扰决策目标,设计基于双层
DDPG
的决策算法,将外层
DDPG
算法模型作为第一决策层选择抗干扰措施的作用域,将内层
MADDPG
算法模型作为第二决策层根据作用域选择抗干扰措施;以干扰类型
、
抗干扰措施
、
转移概率和奖赏函数建立马尔可夫决策过程的四元组,进行迭代运算,获得雷达抗干扰措施组合方式的最优解;其中转移概率为采取当前抗干扰措施时,当前干扰类型转移到下一个干扰类型的概率;奖赏函数为对应的代价函数
。2.
根据权利要求1述的基于多准则多代价函数的雷达智能抗干扰决策方法,其特征在于,将第
i
种抗干扰措施对抗第
j
种干扰类型的抗干扰提升因子定义为
e
ij
:式中
i
=
1,2,
…
,N
,
j
=
1,2,
…
,M
,
N
为抗干扰措施的总个数,
M
为干扰类型的总数;
P
AJ
为采取抗干扰措施后的评价指标,
P0为未受干扰时的评价指标,
P
J
为受干扰时的评价指标
。3.
根据权利要求2述的基于多准则多代价函数的雷达智能抗干扰决策方法,其特征在于,干扰与抗干扰的相关矩阵表示为
GE
:
E
i
为第
i
种抗干扰措施对抗
M
种干扰类型的抗干扰提升因子:
E
i
=
(e
i1
,e
i2
,
…
,
e
ij
,
…
,e
iM
)
T
。4.
根据权利要求3述的基于多准则多代价函数的雷达智能抗干扰决策方法,其特征在于,代价函数一表示为
Reward1:
5.
根据权利要求4述的基于多准则多代价函数的雷达智能抗干扰决策方法,其特征在于,代价函数二表示为
Reward2:
式中
γ1为第一重要性权重,
γ2为第二重要性权重,
α1为第一经验系数,
α2是第二经验系数,
γ1=
0.8
,
γ2=
0.2。6.
根据权利要求5述的基于多准则多代价函数的雷达智能抗干扰决策方法,其特征在于,将雷达的抗干扰决策过程定义为马尔可夫决策过程的四元组
{S,A,P,R}
,其中
S
为
t
时刻雷达输入的干扰类型
s
t
的有限集,
A
为
t
时刻抗干扰措施
a
t
的有限集,
P
为转移概率,
R
为即时奖赏函数
r
t
的有限集;将
t
时刻雷达输出的抗干扰措施组合方式定义为策略
π
(a
t
|s
...
【专利技术属性】
技术研发人员:于雷,魏晶晶,位寅生,许荣庆,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。