一种基于改进SAC的多域联合抗干扰决策方法技术

技术编号:44261010 阅读:15 留言:0更新日期:2025-02-14 22:06
本发明专利技术请求保护一种基于改进SAC的多域联合抗干扰决策方法,属于无线通信技术领域。本方法包括:构建由一对通信用户和干扰机组成的无线通信系统;将通信参数决策过程建模为马尔可夫决策过程;初始化智能体参数和系统参数;智能体根据环境状态生成抗干扰动作,将该动作发送给发送机;发送机执行抗干扰动作,接收机将反馈信息发送给智能体;将样本(s<subgt;t</subgt;,a<subgt;t</subgt;,r<subgt;t</subgt;,s<subgt;t+1</subgt;)存储到经验回放池,更新环境状态;智能体从经验回放池中抽取样本更新价值网络;更新策略网络、目标网络和熵的正则化系数;重复上述交互、更新步骤,直到达到要求。本发明专利技术所提方法能够在未知干扰样式的情况下实现抗干扰决策,提升了通信系统的抗干扰能力和自适应能力,提高了通信双方的通信成功率。

【技术实现步骤摘要】

本专利技术属于无线通信,涉及一种基于改进sac的多域联合抗干扰决策方法。


技术介绍

1、随着信息化技术的不断发展和无线设备的迅速普及,无线通信在日常生活中发挥着日益重要的作用。无线通信技术迅猛发展的同时,所面临的无线电磁环境也愈发复杂。无线通信由于其本身所具有的开放特性,在信息的传输过程中很容易受到外部干扰的攻击,导致通信质量下降甚至无法正常通信。传统的跳频、扩频技术由于采取固定的抗干扰策略,难以抵抗越来越智能化的恶意干扰攻击,所达到的抗干扰性能难以满足抗干扰通信要求。

2、随着以机器学习为核心的人工智能技术的迅速发展,机器学习算法在通信领域的应用越来越广泛。特别是强化学习算法,因其能够在未知环境中通过与环境不断交互,学习最优策略,进行实时动态决策的特点,目前被广泛应用于抗干扰决策领域。现有的抗干扰决策研究大多考虑从时域、频域、功率域和空域出发,构建单域或两域联合的抗干扰决策模型,使用相关强化学习算法智能决策通信参数达到抗干扰效果,实现通信收发双方持续正常通信的目的。考虑单域抗干扰决策模型时,系统模型构造简单,但当干扰方的干扰功率较大或干扰频带本文档来自技高网...

【技术保护点】

1.一种基于改进SAC的多域联合抗干扰决策方法,其特征在于,该方法包括下列步骤:

2.根据权利要求1所述方法,其特征在于,步骤S1中,在一个时隙内,干扰机所产生的干扰不会发生变化;在一个通信时隙内,发送机根据所接收的抗干扰动作,通过数据链路进行信息传输;接收机通过频谱感知获取干扰信道和干扰功率信息,通过反馈链路将所感知到的干扰信息、信干噪比、奖励反馈给智能体;智能体根据所接收到的反馈信息和感知到的环境信息进行学习,输出下一时隙通信方的通信参数;接收端的信干噪比计算公式表示为:

3.根据权利要求1所述方法,其特征在于,步骤S2中,所构建的马尔可夫决策过程由四元组组成...

【技术特征摘要】

1.一种基于改进sac的多域联合抗干扰决策方法,其特征在于,该方法包括下列步骤:

2.根据权利要求1所述方法,其特征在于,步骤s1中,在一个时隙内,干扰机所产生的干扰不会发生变化;在一个通信时隙内,发送机根据所接收的抗干扰动作,通过数据链路进行信息传输;接收机通过频谱感知获取干扰信道和干扰功率信息,通过反馈链路将所感知到的干扰信息、信干噪比、奖励反馈给智能体;智能体根据所接收到的反馈信息和感知到的环境信息进行学习,输出下一时隙通信方的通信参数;接收端的信干噪比计算公式表示为:

3.根据权利要求1所述方法,其特征在于,步骤s2中,所构建的马尔可夫...

【专利技术属性】
技术研发人员:裴二荣张俊何佑泽黎伟王朋飞刘志强
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1