The invention discloses a network resource allocation method based on deep enhanced learning, which includes the following steps: S1, establishing a downlink system model of CSCN based on cache, calculating the data transmission rate of SBS by analyzing the data transmission rate of different links in the user's model; S2, putting forward a game problem, aiming at maximizing network throughput, using game theory to calculate the data transmission rate of SBS. The problem is formulated as a multi-agent non-cooperative game problem; S3, LSTM model is used to predict the user's mobile mode; SBS chooses the user with the best transmission condition according to the user's mobile mode and the buffer state of the SBS connected by the user; S4, establishes RL LSTM framework to enable SBS to complete the effective allocation of channel resources. The invention fully considers the user's mobile mode and the buffer state of the SBS connected by the user, makes the SBS select the user with the best transmission condition, and improves the network throughput of the system.
【技术实现步骤摘要】
基于深度增强学习的网络资源分配方法
本专利技术涉及一种资源分配方法,具体而言,涉及一种基于深度增强学习的网络资源分配方法,属于新型蜂窝网络的信道资源分配领域。
技术介绍
随着众多移动设备的广泛普及和应用,为了满足现阶段移动数据快速增长的需求,业内有关人士提出了大量全新的网络架构。基于缓存的CSCN(Cloud-basedsmallcellnetwork,云小型蜂窝网络CSCN)是目前最具前景的架构之一,其由一个云池和若干个连接于云池的SBS(smallbasestation,小基站)组成。由于SBS相对于宏基站具有功率小、价格低且能够灵活补充宏基站不能覆盖的盲区等优点,因此,对基于缓存的CSCN的资源分配研究非常有意义。传统的随机分配方法通过SBS随机分配信道给用户,尽管这一方法能够实现网络信道资源的分配,但是采用这样的方式,会出现信道资源利用率低的问题,从而会导致用户满意度的降低。综上所述,如何在现有技术的基础上提出一种全新的网络资源分配方法,充分结合诸多现有技术的优点、克服其不足,从而实现对信道资源的合理分配、最大限度地提高系统的网络吞吐量,也就成为了目前业内研究人员亟待解决的问题。
技术实现思路
鉴于现有技术存在上述缺陷,本专利技术的目的是提出一种基于深度增强学习的网络资源分配方法,包括如下步骤:S1、建立基于缓存的CSCN的下行传输链路系统模型,通过分析用户使用模型中不同链路的数据传输速率计算SBS的数据传输速率;S2、提出博弈问题,以最大化网络吞吐量为目标,使用博弈论将问题公式化为一个多智能体非合作博弈问题;S3、使用LSTM模型来预测用户的移动模式 ...
【技术保护点】
1.一种基于深度增强学习的网络资源分配方法,其特征在于,包括如下步骤:S1、建立基于缓存的CSCN的下行传输链路系统模型,通过分析用户使用模型中不同链路的数据传输速率计算SBS的数据传输速率;S2、提出博弈问题,以最大化网络吞吐量为目标,使用博弈论将问题公式化为一个多智能体非合作博弈问题;S3、使用LSTM模型来预测用户的移动模式,SBS根据用户的移动模式以及用户所连接的SBS的缓存状态来选择传输条件最优的用户;S4、建立RL‑LSTM框架,使得SBS完成对信道资源的有效分配。
【技术特征摘要】
1.一种基于深度增强学习的网络资源分配方法,其特征在于,包括如下步骤:S1、建立基于缓存的CSCN的下行传输链路系统模型,通过分析用户使用模型中不同链路的数据传输速率计算SBS的数据传输速率;S2、提出博弈问题,以最大化网络吞吐量为目标,使用博弈论将问题公式化为一个多智能体非合作博弈问题;S3、使用LSTM模型来预测用户的移动模式,SBS根据用户的移动模式以及用户所连接的SBS的缓存状态来选择传输条件最优的用户;S4、建立RL-LSTM框架,使得SBS完成对信道资源的有效分配。2.根据权利要求1所述的基于深度增强学习的网络资源分配方法,其特征在于,S1包括如下步骤:S11、建立基于缓存的CSCN的下行传输链路系统模型,所述基于缓存的CSCN的下行传输链路系统模型由一个云池和连接在云池上的L个SBS组成,每个SBS由l表示,时间段τ内考虑系统的网络吞吐量,将τ划分为F个等时间的时间周期t,τ=Ft;在所述基于缓存的CSCN的下行传输链路系统模型中,U个用户由所有SBS通过C个子信道提供服务,每个子信道由c表示,每个用户连接到最近的SBS,在每个SBS中,每个子信道每次只能分配给一个用户,每个用户每次仅占用一个子信道,pl,c(t)代表在时间周期tSBSl的子信道c的传输功率;内容服务器存储的请求内容为M,每个SBS的缓存存储的内容为G,其中G≤M;用户请求的内容可通过两种传输链路进行独立传输,所述两种传输链路分别为由SBS缓存至用户以及由云池至SBS缓存再至用户。3.根据权利要求2所述的基于深度增强学习的网络资源分配方法,其特征在于,S1还包括如下步骤:S12、计算用户通过由SBS缓存至用户这一链路的传输速率,用户在SBSl的子信道c的数据传输速率为其中,gl,c(t)为信道增益系数,为路径损耗系数,dl,c(t)为在时间周期t用户与SBSl之间的距离,σ2为高斯噪声的功率;S13、计算用户通过由云池至SBS缓存再至用户这一链路的传输速率,用户在SBSl的子信道c的数据传输速率为其中,Vf为用户在回程链路的数据传输速率,Rl,c,1(t)为SBSl通过由SBS缓存至用户这一链路的数据传输速率;S14、结合S12及S13的结果,得出在时间周期t内SBSl的数据传输速率为其中,αl,c,t∈[0,1]表示在时间周期t内在子信道c上SBSl占用的时间百分比;和均为指标函数,若SBSl通过由SBS缓存至用户这一链路通信并占用了子信道c,那么为1,否则为0;若SBSl通过由云池至SBS缓存再至用户这一链路通信并占用了子信道c,那么为1,否则为0。4.根据权利要求3所述的基于深度增强学习的网络资源分配方法,其特征在于,S2包括如下步骤:S21、使用博弈论将问题公式转化为一个多智能体非合作博弈问题,其中L个SBS代表L个博弈方,集合是博弈方l可选择的一组动作向量,|Al|表示动作向量的数量;是Al上的概率空间分布,其中,πl,a=Pr(a=al,a)表示博弈方l采用动作向量al,a的概率;SBSl的一个动作向量表示为al=[(al,1,1,...,al,1,F),...,(al,C,1,...,al,C,F)],每个动作向量代表在时间段τ内一个SBS对所有C个子信道进行分配的配置,包括在每个时间周期tSBS是否选择了子信道c及在时间周期t在子信道c上占用的时间;在τ的每一个时间周期t内每个SBS必须选择一个动作对al,c,t=(xl,c,t,αl,c,t)∈Al,其中,xl,c,t∈{0,1}表示如果在时间周期tSBSl选择了信道c,xl,c,t=1,否则为xl,c,t=0;αl,c,t∈[0,1]表示在...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。