基于约束强化学习的无线网络资源分配方法组成比例

技术编号：36600614 阅读：23 留言：0更新日期：2023-02-04 18:14

本发明专利技术涉及一种基于约束强化学习的无线网络资源分配方法，包括以下步骤：步骤S1:将5G无线网络系统分为增强移动宽带切片、海量机器类通信切片和超可靠低时延通信切片三个网络切片；步骤S2:基于增广拉格朗日的方法，将5G无线网络系统优化问题转化为增广拉格朗日的问题；步骤S3:结合增广拉格朗日与SAC算法，构建基于增广拉格朗日强化学习的资源分配的算法模型，并求解增广拉格朗日的问题，得到最优的分配方案。本发明专利技术实现在有限带宽资源下最大化吞吐量。吞吐量。吞吐量。

全部详细技术资料下载

【技术实现步骤摘要】
基于约束强化学习的无线网络资源分配方法

[0001]本专利技术涉及无线通信领域和计算机
，具体涉及一种基于约束强化学习的无线网络资源分配方法。

技术介绍

[0002]随着工业物联网(IIoT)和5G的发展，越来越多的设备连接到网络中，这些设备会在短时间内产生海量数据。当前，国际电信联盟(ITU)制定了5G的三大应用场景：增强移动带宽(enhanced Mobile Broadband，eMBB)、高可靠低延时通信(Ultra
‑
Reliable Low Latency Communications，URLLC)、海量机器类通信(massive Machine Type Communication，mMTC)。不同的应用场景有不同的网络性能要求，使用网络切片来解决不同场景下的数据是提高网络利用率的一大发展方向。网络切片是利用软件定义网络和网络功能虚拟化技术将单个物理网络划分为多个独立的逻辑(虚拟)网络的过程。切片之间是相互隔离的，只需要一张网络就可以针对不同的场景提供相应的网络切片。在电力行业中，智能电...

【技术保护点】

【技术特征摘要】
1.一种基于约束强化学习的无线网络资源分配方法，其特征在于，包括以下步骤：步骤S1:将5G无线网络系统分为增强移动宽带切片、海量机器类通信切片和超可靠低时延通信切片三个网络切片；步骤S2:基于增广拉格朗日的方法，将5G无线网络系统优化问题转化为增广拉格朗日的问题；步骤S3:结合增广拉格朗日与SAC算法，构建基于增广拉格朗日SAC算法模型，并求解增广拉格朗日的问题，得到最优的分配方案。2.根据权利要求1所述的基于约束强化学习的无线网络资源分配方法，其特征在于，所述步骤S1具体为：设5G无线网络系统中每种类型的设备都被分配到一个指定的切片中；其中增强移动宽带切片中的设备需要一个具有超高吞吐量的网络，并用集合表示；海量机器类通信切片中的设备需要一个具有大规模终端的网络，用集合表示；而超可靠低时延通信切片中的设备需要一个具有超低延迟的网络，用集合表示；然后，用和表示设备集合和基站集合；对于不同类型的设备，每个基站保留一定的带宽，在第m个基站中可用的带宽用B
m
表示，用b
um
表示分配给第u个设备的带宽，考虑到与第u个设备相关的第m个BS，用P
u
表示发射功率，用h
um
表示连接到第m个基站的设备的信道多路径效应引起的功率增益。3.根据权利要求1所述的基于约束强化学习的无线网络资源分配方法，其特征在于，所述5G无线网络系统中设备的速率要求如下：1)在增强移动宽带切片下的设备这些设备的速率要求表示为其中R0表示集合中设备的最低速率要求；2)在海量机器类通信切片下的设备连接到中设备的基站至少会分配一个固定的带宽B0给设备，公式表示为为3)在高可靠低延时通信切片下的设备设备的速率要求表示为其中L表示设备在中发送单个数据包的长度，T0表示发送给集合中设备单个数据包允许的最大传输延迟。4.根据权利要求1所述的基于约束强化学习的无线网络资源分配方法，其特征在于，所述步骤S2具体为：使用二进制向量x
um
来表示用户的归属，给定设备连接到基站的最小功率P0要求，以及第m个基站的发射功率为P
m
，当基站和设备之间的距离d
um
大于某个值，...

【专利技术属性】
技术研发人员：祁琦，邓超平，林国栋，唐志军，陈锦山，林文彬，孙鑫，余斯航，李兆祥，刘龙辉，
申请(专利权)人：国网福建省电力有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人