双层R-D3QN的雷达智能干扰决策方法及系统技术方案

技术编号:41282472 阅读:32 留言:0更新日期:2024-05-11 09:32
本发明专利技术公开了基于双层R‑D3QN的雷达智能干扰决策方法及系统,方法如下:S1、初始化工作模式记忆库和信号参数记忆库大小、记忆库指针,初始化双层R‑D3QN当前值网络和目标值网络、学习率、折扣因子、贪婪因子、工作模式规则库、信号参数规则库;S2、设置训练样本门限值,网络参数更新间隔、训练样本抽取间隔及网络更新计数器,初始化训练步骤数x,设置总训练次数;S3、进行训练;S4、更新工作模式规则库、信号参数规则库;S5、返回执行S3,直到x达到总训练次数,得到训练好的两个R‑D3QN模型的当前值网络;S6、利用当前值网络,对识别的雷达工作模式和信号参数,选择价值最高的干扰策略和参数。本发明专利技术提高了雷达干扰决策能力,针对雷达的工作模式能选择合适的干扰。

【技术实现步骤摘要】

本专利技术属于雷达认知电子战,具体涉及一种双层r-d3qn(rule-duelingdouble deep q-network)雷达智能干扰决策方法及系统,提出了一种新的雷达干扰场景建模,本专利技术可用于认知电子战领域。


技术介绍

1、simon haykin于2006年提出了“认知雷达”概念,相控阵天线技术和数字阵列雷达技术的成熟推动了雷达技术的发展。多功能雷达(mfr)作为代表,逐渐替代了专用雷达,成为各国雷达系统的关键设备。多功能雷达能够根据战场环境和任务需求实时改变工作参数,并具有较强的抗干扰能力。然而,由于雷达技术的不断发展,传统的干扰决策方法已经无法满足新体制雷达复杂多变的工作模式,因此需要一种智能干扰决策方法来应对多功能雷达带来的威胁。

2、强化学习是机器学习中的一个子领域,专门研究智能体如何在复杂的动态环境中进行决策以实现收益最大化。与有监督学习不同,强化学习通过与环境的交互来学习经验并优化策略,不需要显式的数据集和大量的先验知识。强化学习结合了深度学习技术后,形成了深度强化学习(drl),具备强大的环境感知能力和不断优化的决策本文档来自技高网...

【技术保护点】

1.基于双层R-D3QN的雷达智能干扰决策方法,其特征在于,包括以下步骤:

2.根据权利要求1所述基于双层R-D3QN的雷达智能干扰决策方法,其特征在于,步骤S1中,贪婪因子ε的贪婪算法中,令ε随时间衰减,表示如下:

3.根据权利要求2所述基于双层R-D3QN的雷达智能干扰决策方法,其特征在于,步骤S3具体如下:

4.根据权利要求1-3任一项所述基于双层R-D3QN的雷达智能干扰决策方法,其特征在于,步骤S4中,更新工作模式规则库:τij(t+1)=τij(t)+Δτij(t)

5.基于双层R-D3QN的雷达智能干扰决策系统,基于权利要求1...

【技术特征摘要】

1.基于双层r-d3qn的雷达智能干扰决策方法,其特征在于,包括以下步骤:

2.根据权利要求1所述基于双层r-d3qn的雷达智能干扰决策方法,其特征在于,步骤s1中,贪婪因子ε的贪婪算法中,令ε随时间衰减,表示如下:

3.根据权利要求2所述基于双层r-d3qn的雷达智能干扰决策方法,其特征在于,步...

【专利技术属性】
技术研发人员:尹帅陈海龙孙闽红李敏乐仇兆炀
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1