一种动态多目标干扰信道分配与功率决策的方法技术

技术编号:40438586 阅读:26 留言:0更新日期:2024-02-22 23:02
本发明专利技术涉及一种动态多目标干扰信道分配与功率决策的方法。包括:以每个干扰站为一个智能体,将干扰信道分配与功率决策的优化问题建立为多智能体马尔科夫决策过程的模型;利用深度强化学习方法基于集中式训练和分布式决策框架训练多个智能体;将训练好的多个智能体进行在线部署。本发明专利技术通过将无线通信对抗场景下的多目标干扰信道和功率的联合分配问题建模为多智能体马尔科夫决策过程,采用多智能体深度强化学习方法开发了一种集中式训练分布式决策架构,从而有效解决多个干扰站针对动态环境下多个高移动通信目标的现实干扰问题,在考虑干扰成功率的同时兼顾了干扰功率损耗。

【技术实现步骤摘要】

本专利技术实施例涉及无线通信网络,尤其涉及一种动态多目标干扰信道分配与功率决策的方法


技术介绍

1、在现代生活以及军事活动中,无线通信网络提供了无线互联和通信接入的便捷方式,但由于无线网络开放、节点分布广泛、存在频谱复用以及空间电磁环境复杂等因素,节点间通信易受到各种互扰和干扰,这使得无线通信对抗成为一个重要的研究课题。

2、抗干扰能力的不断提高给干扰带来了巨大的挑战。为了应对先进的抗干扰技术,许多学者开展了无线通信干扰技术的研究。作为干扰者,通过优化分配有限的干扰资源,可以在最大化干扰资源利用率的同时提升干扰成功率。但现有干扰资源分配问题的研究主要集中在单维域的干扰方法上,且较多关注干扰信道的选择,对干扰功率的优化分配研究相对较少。

3、相关技术中,在仅有一个干扰系统和一个通信系统的频谱对抗场景下,针对动态环境下干扰信道和功率的联合决策问题,提出了一种具有并行学习和联合决策功能的drl干扰决策方法。

4、关于上述技术方案,专利技术人发现至少存在如下一些技术问题:

5、没有针对动态环境下干扰信道和干扰功率的本文档来自技高网...

【技术保护点】

1.一种动态多目标干扰信道分配与功率决策的方法,其特征在于,包括:

2.根据权利要求1所述的动态多目标干扰信道分配与功率决策的方法,其特征在于,所述利用深度强化学习方法基于集中式训练和分布式决策框架训练多个智能体的步骤中,还包括:

3.根据权利要求2所述的动态多目标干扰信道分配与功率决策的方法,其特征在于,所述采用双深度Q网络来训练多个智能体的步骤中,还包括:

4.根据权利要求3所述的动态多目标干扰信道分配与功率决策的方法,其特征在于,所述为每个智能体设置并维护一个双深度Q网络,通过运行多个回合来训练网络的步骤中,还包括:

<p>5.根据权利要求...

【技术特征摘要】

1.一种动态多目标干扰信道分配与功率决策的方法,其特征在于,包括:

2.根据权利要求1所述的动态多目标干扰信道分配与功率决策的方法,其特征在于,所述利用深度强化学习方法基于集中式训练和分布式决策框架训练多个智能体的步骤中,还包括:

3.根据权利要求2所述的动态多目标干扰信道分配与功率决策的方法,其特征在于,所述采用双深度q网络来训练多个智能体的步骤中,还包括:

4.根据权利要求3所述的动态多目标干扰信道分配与功率决策的方法,其特征在于,所述为每个智能体设置并维护一个双深度q网络,通过运行多个回合来训练网络的步骤中,还包括:

5.根据权利要求4所述的动态多目标干扰信道分配与功率决策的方法,其特征在于,所述得到所述智能体的最终观测输入的步骤中,还包括:

6.根据权利要求5所述的动态多目标干扰信道分配与功率决策的方法,...

【专利技术属性】
技术研发人员:许华彭翔庞伊琼张悦饶宁
申请(专利权)人:中国人民解放军空军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1