System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种应对不完全信道信息的模糊学习抗干扰方法和系统技术方案_技高网

一种应对不完全信道信息的模糊学习抗干扰方法和系统技术方案

技术编号:40363352 阅读:10 留言:0更新日期:2024-02-09 14:51
本发明专利技术涉及无线通信技术领域,具体公开了一种应对不完全信道信息的模糊学习抗干扰方法和系统,包括:将不完全信道信息映射至模糊空间,再通过模糊收益函数得到用户与干扰的模糊收益;利用斯坦伯格博弈理论,建立用户与干扰的对抗过程模型;创建用户与干扰的Q表,初始化用户的通信功率及干扰的干扰功率;获取干扰模糊收益,利用函数对干扰的模糊收益进行评价,得到评价值;更新干扰的Q表,并重新确定干扰的干扰功率,重复计算干扰的干扰功率直至最大迭代次数;获取用户模糊收益,利用满意度函数对干扰的模糊收益进行评价,得到评价值;更新用户的Q表,并重新确定用户通信功率,重复计算用户通信功率直至最大迭代次数。

【技术实现步骤摘要】

本专利技术涉及无线通信,具体涉及一种应对不完全信道信息的模糊学习抗干扰方法和系统


技术介绍

1、随着无线通信网络的发展,恶意干扰也日益猖獗,给无线通信系统的安全性和可靠性带来了巨大挑战。虽然通信抗干扰技术已经取得了一些成果,但其中许多研究对象为非智能干扰机,它们本质上仍属于传统抗干扰范畴,即:干扰模式相对固定、信道环境较为稳定。对于信道状态不确定条件下的抗干扰方法,目前还缺乏深入的研究。

2、针对信道状态动态不确定所带来的抗干扰问题求解困难,目前较为常见的解决途径主要有以下两种方法,即(1)利用无模型强化学习(l. xiao et al., “iot securitytechniques based on machine learning: how do iot devices use ai to enhancesecurity?,” ieee signal process mag, vol. 35, no. 5, pp. 41-49, sept. 2018.),在未知环境下以不断试错的方式对环境进行探索,进而不断调整智能体决策使其最终收敛至最佳策略。(2)运用统计学工具对信道状态信息,如信道增益、信干噪比等参数的分布情况进行统计,再有针对性地对用户效用进行贝叶斯优化(l. jia et al., “bayesianstackelberg game for antijamming transmission with incomplete information,”ieee commun. lett., vol. 20, no. 10, pp. 1991-1994, oct. 2016.)。上述优化过程通常是在稳态环境下得到动作的清晰回报,再利用清晰回报来优化行动策略。

3、虽然这些方法能够在一定程度上解决干扰环境下的高动态、不确定问题,但仍存在以下不足:

4、(1)强化学习方法实时进行“决策-反馈-调整”,本质上在于挖掘干扰变化规律,对于无明显规律或信道状态变化极快的场景,算法很有可能是不收敛的。

5、(2)基于统计意义上的优化,本质在于优化用户长期回报,存在获取统计信息开销大、时间成本高、单个时隙的波动收益无法直接指导决策优化等现实问题。

6、因此,如何提供一种应对不完全信道信息的模糊学习抗干扰方法和系统,是本领域技术人员亟待解决的技术问题。


技术实现思路

1、为实现本专利技术目的提供的一种应对不完全信道信息的模糊学习抗干扰方法,包括:

2、步骤s1:将不完全信道信息映射至模糊空间并将信道增益用模糊数表示,再通过模糊收益函数得到用户模糊收益与干扰模糊收益;

3、步骤s2:利用斯坦伯格博弈理论,建立用户与干扰的对抗过程模型;

4、步骤s3:根据所述模糊收益函数和所述对抗过程模型,利用q-学习算法分别创建用户q表与干扰q表,初始化用户当前的通信功率及当前的干扰功率;

5、步骤s4:获取干扰模糊收益,对所述干扰模糊收益进行评价,得到评价值;

6、步骤s5:更新干扰q表,并根据更新后的干扰q表重新确定干扰功率,跳转到步骤s4,不断重复步骤s4和s5过程,直至到达最大迭代次数;

7、步骤s6:获取用户模糊收益,利用满意度函数对所述干扰模糊收益进行评价,得到评价值;

8、步骤s7:更新用户q表,并根据更新后的用户q表重新确定用户的通信功率,跳转到步骤s4,不断重复步骤s4至s7过程,直至到达最大迭代次数。

9、在其中一些具体实施例中,在步骤s1中,所述信道增益的隶属度函数为:

10、;

11、其中, m为信道增益的概率密度取最大值时自变量 x的值; l为信道增益的概率密度取极小值时自变量 x的一个值, r为信道增益的概率密度取极小值时自变量 x的另一个取值, l< r。

12、在其中一些具体实施例中,在步骤s1中,所述模糊收益函数包括用户模糊收益函数和干扰模糊收益函数,所述用户模糊收益函数为:

13、;

14、所述干扰模糊收益函数为:

15、;

16、其中,表示用户通信功率,表示干扰功率;为用户信道增益的模糊数表示,为干扰信道增益的模糊数表示;表示用户单位功率成本,表示干扰单位功率成本;为背景噪声功率。

17、在其中一些具体实施例中,所述模糊收益的评价公式为:

18、;

19、其中,为代表用户活或干扰收益偏好的满意度函数,包括:

20、乐观:;

21、中性:;

22、悲观:;

23、为用户或干扰模糊收益的隶属度函数。

24、在其中一些具体实施例中,用户q表或干扰q表更新公式为:

25、;

26、其中,表示q表中选择动作的q值;表示学习率;为上述用户或干扰的模糊收益评价值。

27、在其中一些具体实施例中,在步骤s5和步骤s7中,根基于如下公式根据q表确定用户通信功率与干扰功率:

28、<mstyle displaystyle="true" mathcolor="#000000"><msubsup><mi>q</mi><mrow /><mi>t</mi></msubsup><mrow><mo>(</mo><mi>a</mi><mo>)</mo></mrow><mi>=</mi><mfrac><mrow><mi>exp</mi><mrow><mo>[</mo><mrow><msub><mi>q</mi><mrow /></msub><mrow><mo>(</mo><mi>a</mi><mo>)</mo></mrow><mi>/</mi><mi>τ</mi></mrow><mo>]</mo></mrow></mrow><mstyle displaystyle="true"><munder><mo>∑</mo&本文档来自技高网...

【技术保护点】

1.一种应对不完全信道信息的模糊学习抗干扰方法,其特征在于,包括:

2.根据权利要求1所述的应对不完全信道信息的模糊学习抗干扰方法,其特征在于,在步骤S1中,所述信道增益的隶属度函数为:

3.根据权利要求1所述的应对不完全信道信息的模糊学习抗干扰方法,其特征在于,在步骤S1中,所述模糊收益函数包括用户模糊收益函数和干扰模糊收益函数,所述用户模糊收益函数为:

4.根据权利要求1所述的应对不完全信道信息的模糊学习抗干扰方法,其特征在于,所述模糊收益的评价公式为:

5.根据权利要求1所述的应对不完全信道信息的模糊学习抗干扰方法,其特征在于,用户Q表或干扰Q表的更新公式为:

6.根据权利要求1所述的应对不完全信道信息的模糊学习抗干扰方法,其特征在于,在步骤S5和步骤S7中,基于如下公式根据Q表确定用户通信功率与干扰功率:

7.一种应对不完全信道信息的模糊学习抗干扰系统,其特征在于,包括:

8.根据权利要求7所述的应对不完全信道信息的模糊学习抗干扰系统,其特征在于,所述模糊收益函数包括用户的模糊收益函数和干扰模糊收益函数,所述用户模糊收益函数为:

9.根据权利要求7所述的应对不完全信道信息的模糊学习抗干扰系统,其特征在于,所述模糊收益的评价公式为:

10.根据权利要求7所述的应对不完全信道信息的模糊学习抗干扰系统,其特征在于,用户Q表或干扰Q表更新公式为:

...

【技术特征摘要】

1.一种应对不完全信道信息的模糊学习抗干扰方法,其特征在于,包括:

2.根据权利要求1所述的应对不完全信道信息的模糊学习抗干扰方法,其特征在于,在步骤s1中,所述信道增益的隶属度函数为:

3.根据权利要求1所述的应对不完全信道信息的模糊学习抗干扰方法,其特征在于,在步骤s1中,所述模糊收益函数包括用户模糊收益函数和干扰模糊收益函数,所述用户模糊收益函数为:

4.根据权利要求1所述的应对不完全信道信息的模糊学习抗干扰方法,其特征在于,所述模糊收益的评价公式为:

5.根据权利要求1所述的应对不完全信道信息的模糊学习抗干扰方法,其特征在于,用户q表或干扰q表的更新公式为:

6...

【专利技术属性】
技术研发人员:贾录良张云鹏熊达鹏王宏艳张云帆曹文婷张云阳李轶南
申请(专利权)人:中国人民解放军战略支援部队航天工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1