一种基于联邦学习的频谱资源管理分配方法组成比例

技术编号：29051738 阅读：28 留言：0更新日期：2021-06-26 06:16

本发明专利技术公开了一种基于联邦学习的频谱资源管理分配方法。该方法包括终端设备从环境中收集状态信息；若信息变化超过门限值，则做出信道传输的频谱、子信道和传输功率决策；终端设备收集决策后下一时刻的状态信息和奖励信息，并采用梯度下降法训练主网络中的行动者网络和评论家网络；当终端设备累计梯度达到预设梯度门限值后将其主网络参数上传至基站；基站收集的主网络参数量达到门限值后，根据预设权重将主网络参数聚合并广播给所有终端设备；终端设备接收到聚合参数后更新其主网络和目标网络的参数。本发明专利技术为了解决现有技术中频谱利用率低，用户隐私易泄露等问题，采用了异步的联邦学习方式，在解决以上问题的同时还具有通信消耗低的优点。信消耗低的优点。信消耗低的优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于联邦学习的频谱资源管理分配方法

[0001]本专利技术涉及一种频谱资源管理分配方法，尤其涉及一种基于联邦学习的频谱资源管理分配方法。

技术介绍

[0002]在未来通信网络中，终端设备规模的日益增长和多样化服务类型不断涌现，对网络容量形成巨大压力。即便是使用全频谱，面对庞大的带宽需求，仍然存在挑战。只有充分提升全频谱的利用率，才能有效缓解网络负荷，最大程度满足用户服务质量。然而，相对于现有无线通信系统，全频谱网络频谱资源呈现出差异性和高动态性，而现有的基于数学优化理论的频谱资源管理机制缺乏对可用频谱资源的预测能力，所以难以有效应对。如何适应频谱和业务的动态性、随机性，进而实现适变、高效地使用全频谱资源成为难点。
[0003]若采用认知无线电中的单用户感知，容易受到阴影效应、多径衰落以及终端隐蔽的影响，从而导致次级用户的环境感知结果产生偏差。多个次级用户对环境感知的不充分会引起次级用户的决策发生错误，从而导致发生冲突，大大降低频谱利用率。
[0004]为此，提出多用户联合感知频谱接入方案，提高频谱利用率。...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的频谱资源管理分配方法，其特征在于，包括以下步骤：S1、终端设备从环境中收集状态信息；S2、终端设备判断步骤S1收集的当前时刻状态信息和上一时刻状态信息变化差值是否超过预设差值门限值，若是，执行步骤S3，否则返回步骤S1；S3、终端设备根据当前状态信息对主网络中的行动者网络信道传输的频谱、子信道和传输功率进行决策；S4、终端设备收集决策后下一时刻的状态信息和奖励信息，并将当前时刻状态信息、当前时刻动作、下一时刻状态信息和奖励信息组成经验元组，把经验元组放入记忆池；S5、终端设备利用所述步骤S4放入记忆池的经验元组采用梯度下降法训练主网络中的行动者网络和评论家网络；S6、判断终端设备累计梯度是否达到预设梯度门限值，若是，执行步骤S7，否则返回所述步骤S1；S7、终端设备将其主网络参数上传至基站；S8、基站判断其收集的主网络参数量是否达到预设收集门限值，若是，根据设定权重将所有的主网络参数进行聚合并广播给所有终端设备并执行步骤S9，否则继续收集主网络参数；S9、终端设备根据接收到的聚合参数更新其主网络和目标网络的参数，并返回所述步骤S1。2.如权利要求1所述的一种基于联邦学习的频谱资源管理分配方法，其特征在于：所述步骤S1收集的状态信息包括当前时刻信道增益信息g
ijk
(t)、上一时刻信道增益信息g
ijk
(t
‑
1)、上一时刻的动作信息a
k
(t
‑
1)和上一时刻的信道干扰信息I
ijk
(t
‑
1)，表示为：S
tk
＝{{g
ijk
(t)}
i∈N,j∈Bi
,{g
ijk
(t
‑
1)}
i∈N,j∈Bi
,{I
ijk
(t
‑
1)}
i∈N,j∈Bi
,a
k
(t
‑
1)}。3.如权利要求2所述的一种基于联邦学习的频谱资源管理分配方法，其特征在于，所述步骤S1中收集的上一时刻信道干扰信息表示为：其中为上一时刻终端设备m对i频段的j子信道的动作信息，p
m
(t
‑
1)为上一时刻终端设备m的发射功率，为上一时刻终端设备m在i频段的j子信道的信道增益。4.如权利要求3所述的一种基于联邦学习的频谱资源管理分配方法，其特征在于，所述步骤S4中的奖励信息表示为：其中x
ijk
(t)为当前时刻设备k对...

【专利技术属性】
技术研发人员：张科，袁鑫，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人