一种基于深度强化学习的异构蜂窝网络联合优化方法技术

技术编号：19516530 阅读：21 留言：0更新日期：2018-11-21 10:48

本发明专利技术属于无线通信技术领域，具体涉及一种基于深度强化学习的异构蜂窝网络联合优化方法。针对下行链路异构蜂窝网络中的用户关联，资源分配和功率控制的联合优化问题，在考虑到联合优化问题的非凸性和组合特性的前提下，在建立异构蜂窝网络系统模型基础上，通过提出多智能体深度强化学习优化策略，结合用户满意度和运营商追求利益的条件，利用深度强化学习方法，获得最优的资源分配、用户关联和功率控制联合策略，从而实现整个网络长期系统效用的最大化。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度强化学习的异构蜂窝网络联合优化方法
本专利技术属于无线通信
，具体涉及一种基于深度强化学习的异构蜂窝网络联合优化方法。
技术介绍
随着无线通信技术的快速发展，异构蜂窝网络面临着日益增长的网络容量需求的巨大挑战。异构蜂窝网络可以平衡流量负载和降低小型设备费用，这在下一代蜂窝网络中被认为是有前途的技术。目前异构蜂窝网络依旧存在诸多问题，如用户关联、资源分配和功率控制等问题。由于联合优化问题的高维动作空间，使用强化学习方法获得最优策略具有一定难度。考虑到联合优化问题的高维动作空间，深度强化学习(DeepReinforcementLearning,DRL)可以被认为是一个有希望来处理复杂的控制问题的技术。通过将深度神经网络(DeepNeuralNetwork,DNN)与强化学习相结合，可以提高深度Q网络(DeepQ-Network,DQN)的学习性能和学习效率。因此，本方法提出基于深度强化学习的异构蜂窝网络联合优化方法。
技术实现思路
为了克服上述现有技术存在的不足，本专利技术的目的在于提出一种基于深度强化学习的异构蜂窝网络联合优化方法。为了达到上述目的，本专利技术所采用的技术方案是：一种基于深度强化学习的异构蜂窝网络联合优化方法，其特征在于，所述方法包括如下步骤：针对下行链路异构蜂窝网络中的用户关联，资源分配和功率控制的联合优化问题，在考虑到联合优化问题的非凸性和组合特性的前提下，在建立异构蜂窝网络系统模型基础上，通过提出多智能体深度强化学习优化策略，结合用户满意度(Qualityofservice，Qos)和运营商追求利益的条件，利用深度强化学习...

【技术保护点】
1.一种基于深度强化学习的异构蜂窝网络联合优化方法，其特征在于，所述方法包括如下步骤：针对下行链路异构蜂窝网络中的用户关联，资源分配和功率控制的联合优化问题，在考虑到联合优化问题的非凸性和组合特性的前提下，在建立异构蜂窝网络系统模型基础上，通过提出多智能体深度强化学习优化策略，结合用户满意度和运营商追求利益的条件，利用深度强化学习方法，获得最优的资源分配、用户关联和功率控制联合策略，从而实现整个网络长期系统效用的最大化。

【技术特征摘要】
1.一种基于深度强化学习的异构蜂窝网络联合优化方法，其特征在于，所述方法包括如下步骤：针对下行链路异构蜂窝网络中的用户关联，资源分配和功率控制的联合优化问题，在考虑到联合优化问题的非凸性和组合特性的前提下，在建立异构蜂窝网络系统模型基础上，通过提出多智能体深度强化学习优化策略，结合用户满意度和运营商追求利益的条件，利用深度强化学习方法，获得最优的资源分配、用户关联和功率控制联合策略，从而实现整个网络长期系统效用的最大化。2.根据权利要求1所述的基于深度强化学习的异构蜂窝网络联合优化方法，其特征在于，所述建立异构蜂窝网络系统模型实现过程包括：考虑由MBS、FBSs和用户设备(UserEquipments，UEs)组成的两层异构蜂窝网络，假设某一个MBS信号覆盖范围内存在L个FBSs，即FBS1,...,FBSL，于是，所有基站可表示为BS＝{MBS,FBS1,...,FBSL}，假设所有的基站和N个UEs都只有一个通信天线，BS可以在K个信道上工作；对于任意一个UE，定义二元信道分配变量为：其中，在时间t，如果第i个UE使用信道Ck，则否则虽然使用相同信道的UEs数量是不限的，但是UE每次只能选择一个信道，因此，对于每一个UE，有此外，定义二元联合基站变量：其中，在时间t，如果第i个用户连接到第l个基站，则否则，考虑到每个UE只能接入一个基站，对于每一个UE，有假设在时间t时第i个UE使用信道Ck连接BSL的传输功率为由于FBSs被部署在MBS的无线电覆盖范围内，于是，第i个UE处的瞬时信号干扰比为：其中，是BSL和第i个用户在信道Ck上的即时连接增益，W是信道带宽，N0是噪声谱功率；于是，第i个UE在信道Ck上收到的下行数据率为因此，第i个UE获得的总数据率：在双层异构蜂窝网络中，UE想保证其QoS要求下使BS的传输速率最大化，BS希望以最低的运营成本维持UE的QoS要求，因此，要处理相互冲突的目标在UE和BS之间考虑BS的运营成本；同时，为了保证每个UE的服务质量，第i个UE的瞬时信号干扰必须小于用户服务的最低要求Ωi，即此外，假设第k个信道下行链路的数据传输成本为：其中，λ1是BS传输功率的单位价格，于是，第i个UE总传输成本为：定义第i个UE的效用wi(t)为收入利润与运营成本之差，可以写成其中，ρ>0为每个用户单位速率的收益；在异构网络中，每个UE考虑用户关联，资源分配和功率控制的联合优化问题以最大化其长期奖励，定义长期奖励lri(t)作为无限期瞬时奖励的总和，即其中，γ是折扣因子，当γ∈[0,1)表示更重视长期收益。3.根据权利要求1所述的基于深度强化学习的异构蜂窝网络联合优化方法，其特征在于，所述多智能体深度强化学习优化策略，所采取的实现过程包括：定义状态空间，行动空间和奖励函数有关的基本强化学习元素，在这种异构蜂窝网络中，每个UE都扮演着一个智能体的角色，因此，提出分布式多智能体强化学习优化策略；状态空间：目标状态s(t)由N个UE的服务质量综合确定；s(t)＝{s1(t),s2(t),...,sN(t)}当用户对服务质量满意时就等于1，不满意就是0；动作空间：每个UE选择附近的BS、传输信道和功率水平；考虑到实际应用场景，发射功率一般为离散值；于是，考虑M个功率水平，即P1,...,PM；功率水平选择变量定义为：其中，如果BS选择传输功率pm，则否则，考虑到BS传输时只能选择一种功率水平，于是有：于是，每一个UE的动作空间中四个变量：奖励函数：当UE采取动作时就会获得相应的奖励，UE的奖励函数为：...

【专利技术属性】
技术研发人员：赵楠，贺潇，范孟林，田超，樊鹏飞，裴一扬，武明虎，熊炜，刘聪，曾春艳，
申请(专利权)人：湖北工业大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人