一种非授权频段公平共存接入方法及系统技术方案

技术编号：33730867 阅读：22 留言：0更新日期：2022-06-08 21:26

本发明专利技术公开了一种非授权频段公平共存接入方法及系统，该方法包括：将新接入非授权频段的节点定义为智能体，并进行网络初始化；智能体根据当前状态决策并执行动作，得到对应的经验；将经验存入经验池，并基于经验回放机制对智能体的深度Q网络进行训练更新；生成虚拟经验并对智能体进行训练更新；按照预设时间间隔从经验池取出经验对虚拟多址接入环境模型进行训练更新；循环更新步骤。该系统包括：初始化模块、执行动作模块、第一更新模块、第二更新模块、第三更新模块和循环模块。通过使用本发明专利技术，能够使新接入非授权频段的节点根据环境调整接入策略，从而更加快速且平稳地实现在非授权频段中的公平共存。本发明专利技术可广泛应用于无线通信领域。通信领域。通信领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种非授权频段公平共存接入方法及系统

[0001]本专利技术涉及无线通信领域，尤其涉及一种非授权频段公平共存接入方法及系统。

技术介绍

[0002]在无线通信领域中，非授权频段作为授权频段的补充，允许4G、5G等蜂窝网络设备接入到非授权频段中进行传输。考虑到新接入节点需要与非授权频段中原本存在的其他MAC节点(如WiFi节点)共存，因此如何保证非授权频段中不同MAC节点之间的公平性接入成为了当前的一个研究热点。
[0003]目前基于数据驱动的无模型强化学习算法是解决多址接入问题的热门方法，但是受限于其边训练边执行的方式，数据量不足将导致算法收敛速度慢或者无法在有限时间内收敛到最优解。尤其是在当前以及未来的无线网络中，网络环境往往变化较快，同时网络中有着大量的数据传输，这就要求接入算法能够快速有效地收敛到最优接入策略。因此如何充分利用有限的真实数据，或者如何快速扩充智能体训练所需的数据样本，从而提高智能体的拟合速度，成为了目前急需解决的技术问题。

技术实现思路

[0004]为了解决上述技术问题，本专利技术的目的是提供一种非授权频段公平共存接入方法及系统，能够快速产生大量的虚拟数据，使智能体的收敛效果得到有效提升。
[0005]本专利技术所采用的第一技术方案是：一种非授权频段公平共存接入方法，包括以下步骤：
[0006]S1、将新接入非授权频段的节点定义为智能体，并进行网络初始化；
[0007]S2、智能体根据当前状态决策并执行动作，得到对应的经验；
[0008]S...

【技术保护点】

【技术特征摘要】
1.一种非授权频段公平共存接入方法，其特征在于，包括以下步骤：S1、将新接入非授权频段的节点定义为智能体，并进行网络初始化；S2、智能体根据当前状态决策并执行动作，得到对应的经验；S3、将经验存入经验池，并基于经验回放机制对智能体的深度Q网络进行训练更新；S4、生成虚拟经验并对智能体进行训练更新；S5、按照预设时间间隔从经验池取出经验对虚拟多址接入环境模型进行训练更新；S6、循环步骤S2
‑
S5直至达到预设的迭代步数。2.根据权利要求1所述一种非授权频段公平共存接入方法，其特征在于，所述网络初始化包括智能体的深度Q网络初始化和虚拟多址接入环境模型的深度神经网络初始化，所述深度Q网络包括策略网络和目标网络，所述虚拟多址接入环境模型包括状态模型和奖励模型。3.根据权利要求2所述一种非授权频段公平共存接入方法，其特征在于，所述智能体根据当前状态决策并执行动作中决策策略的公式表示如下：上式中，f
α
表示α公平性局部效用函数，1
‑
∈表示选择一个当前策略下的最优动作的概率，∈表示选择一个随机动作的概率，N表示节点数量，Q
(i)
(s
t
,a)表示节点i所对应的“状态
‑
动作对”的价值，s
t
表示环境状态，a表示动作，random action表示随机动作。4.根据权利要求3所述一种非授权频段公平共存接入方法，其特征在于，所述得到对应的经验的表达式如下：e
t
＝{c
t
,a
t
,r
t
,c
t+1
}上式中，e
t
表示经验，c
t
表示在时间步t时的信道状态，a
...

【专利技术属性】
技术研发人员：孙兴华，许浩维，詹文，王玺钧，
申请(专利权)人：中山大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人