【技术实现步骤摘要】
本专利技术涉及网络优化设计,具体为基于逆强化学习的多小区网络功率分配方法及系统。
技术介绍
1、近来,无线网络发展迅速,用户设备和传输数据量也急剧增加。为保证多小区网络中用户的服务质量(quality of service,qos),通过优化基站(bs)的发射功率来进行干扰抑制备受关注。
2、一般来说,传统的优化方法可以用于多小区网络的功率分配问题,然而,当网络规模较大时,传统优化方法的求解时间复杂度较高,难以部署在实际环境中。因此,如何实时地求解该问题对功率分配至关重要。
技术实现思路
1、(一)解决的技术问题
2、针对现有技术的不足,本专利技术提供了基于逆强化学习的多小区网络功率分配方法及系统,能在用户设备(ues)的最小数据速率要求的约束下找到最优的功率分配策略。
3、(二)技术方案
4、为实现以上目的,本专利技术通过以下技术方案予以实现:
5、第一方面,提供了一种基于逆强化学习的多小区网络功率分配方法,所述方法包括:
>6、接收待优本文档来自技高网...
【技术保护点】
1.一种基于逆强化学习的多小区网络功率分配方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种基于逆强化学习的多小区网络功率分配方法,其特征在于:所述优化问题表示为:
3.根据权利要求2所述的一种基于逆强化学习的多小区网络功率分配方法,其特征在于:每个用户的速率Rn,k的计算公式如下:
4.根据权利要求3所述的一种基于逆强化学习的多小区网络功率分配方法,其特征在于:在将状态空间和动作空间输入到预设的逆强化学习模型中进行训练前,进行设置处理,所述设置处理包括设置最大训练轮数Tmax、最大时隙数Tslot和更新轮数Tupdat
5...
【技术特征摘要】
1.一种基于逆强化学习的多小区网络功率分配方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种基于逆强化学习的多小区网络功率分配方法,其特征在于:所述优化问题表示为:
3.根据权利要求2所述的一种基于逆强化学习的多小区网络功率分配方法,其特征在于:每个用户的速率rn,k的计算公式如下:
4.根据权利要求3所述的一种基于逆强化学习的多小区网络功率分配方法,其特征在于:在将状态空间和动作空间输入到预设的逆强化学习模型中进行训练前,进行设置处理,所述设置处理包括设置最大训练轮数tmax、最大时隙数tslot和更新轮数tupdate。
5.根据权利要求4所述的一种基于逆强化学习的多小区网络功率分配方法,其特征在于:在将状态空间和动作空间输入到预设的逆强化学习模型中进行训练前,进行初始化处理,所述初始化处理包...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。