基于逆强化学习的多小区网络功率分配方法及系统技术方案

技术编号：40464010 阅读：22 留言：0更新日期：2024-02-22 23:18

本发明专利技术提供基于逆强化学习的多小区网络功率分配方法及系统，涉及网络优化设计领域。该基于逆强化学习的多小区网络功率分配方法，包括：接收待优化小区中用户设备信息及优化基站信息；根据待优化小区中用户设备信息及优化基站信息建立优化问题，所述优化问题目标是在满足每个用户设备最小数据速率的同时最大化速率和；获取状态空间和动作空间，所述状态空间包括上一时隙的所有用户的信道信息、动作信息和奖励信息；将状态空间和动作空间输入到预设的逆强化学习模型中进行训练，供预设的逆强化学习模型学习得到奖励函数；利用所述奖励函数求解优化问题。该方法能在用户设备(UEs)的最小数据速率要求的约束下找到最优的功率分配策略。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及网络优化设计，具体为基于逆强化学习的多小区网络功率分配方法及系统。

技术介绍

1、近来，无线网络发展迅速，用户设备和传输数据量也急剧增加。为保证多小区网络中用户的服务质量(quality of service，qos)，通过优化基站(bs)的发射功率来进行干扰抑制备受关注。

2、一般来说，传统的优化方法可以用于多小区网络的功率分配问题，然而，当网络规模较大时，传统优化方法的求解时间复杂度较高，难以部署在实际环境中。因此，如何实时地求解该问题对功率分配至关重要。

技术实现思路

1、(一)解决的技术问题

2、针对现有技术的不足，本专利技术提供了基于逆强化学习的多小区网络功率分配方法及系统，能在用户设备(ues)的最小数据速率要求的约束下找到最优的功率分配策略。

3、(二)技术方案

4、为实现以上目的，本专利技术通过以下技术方案予以实现：

5、第一方面，提供了一种基于逆强化学习的多小区网络功率分配方法，所述方法包括：>

6、接收待优本文档来自技高网...

【技术保护点】

1.一种基于逆强化学习的多小区网络功率分配方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种基于逆强化学习的多小区网络功率分配方法，其特征在于：所述优化问题表示为：

3.根据权利要求2所述的一种基于逆强化学习的多小区网络功率分配方法，其特征在于：每个用户的速率Rn，k的计算公式如下：

4.根据权利要求3所述的一种基于逆强化学习的多小区网络功率分配方法，其特征在于：在将状态空间和动作空间输入到预设的逆强化学习模型中进行训练前，进行设置处理，所述设置处理包括设置最大训练轮数Tmax、最大时隙数Tslot和更新轮数Tupdate。

5...

【技术特征摘要】

1.一种基于逆强化学习的多小区网络功率分配方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种基于逆强化学习的多小区网络功率分配方法，其特征在于：所述优化问题表示为：

3.根据权利要求2所述的一种基于逆强化学习的多小区网络功率分配方法，其特征在于：每个用户的速率rn，k的计算公式如下：

4.根据权利要求3所述的一种基于逆强化学习的多小区网络功率分配方法，其特征在于：在将状态空间和动作空间输入到预设的逆强化学习模型中进行训练前，进行设置处理，所述设置处理包括设置最大训练轮数tmax、最大时隙数tslot和更新轮数tupdate。

5.根据权利要求4所述的一种基于逆强化学习的多小区网络功率分配方法，其特征在于：在将状态空间和动作空间输入到预设的逆强化学习模型中进行训练前，进行初始化处理，所述初始化处理包...

【专利技术属性】
技术研发人员：董瑞，熊轲，田兴聪，张锐晨，
申请(专利权)人：北京交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人