一种信道接入策略的确定方法及装置制造方法及图纸

技术编号:22568533 阅读:45 留言:0更新日期:2019-11-16 13:34
本发明专利技术实施例提供了一种信道接入策略的确定方法及装置,其中,信道接入策略的确定方法包括:按照协调用户收益值和用户后悔值的权重,分别调整用户收益值及用户后悔值,确定基站的累计效应函数值,这样考虑了用户收益值和用户后悔值,使用权重平衡了用户收益值和用户后悔值,完成对信道接入策略进行优化,相较于现有技术,可以得到更优的服务用户的信道接入策略及服务用户的调度形式,提高网络资源的优化性能。

A method and device for determining channel access strategy

The embodiment of the invention provides a method and device for determining the channel access strategy, wherein the method for determining the channel access strategy includes: adjusting the user income value and the user regret value respectively according to the weight of the coordinated user income value and the user regret value, and determining the cumulative effect function value of the base station, thus taking the user income value and the user regret value into account, balancing the use of the weight Compared with the existing technology, it can get better channel access strategy and scheduling form of service users, and improve the optimization performance of network resources.

【技术实现步骤摘要】
一种信道接入策略的确定方法及装置
本专利技术涉及通信
,特别是涉及一种信道接入策略的确定方法及装置。
技术介绍
随着移动通信的蓬勃发展,未来第五代移动通信技术(5th-Generation,简称5G)在复杂密集传输场景下,需网络资源的高效利用与优化分配。而为了应对无线服务接入需求和有效网络资源之间的矛盾,人们提出了多种资源优化利用的方案,资源优化利用的方案可以包括:对信道接入策略进行优化。目前采用强化学习可以完成对信道接入策略进行优化。而,利用强化学习算法对信道接入策略进行优化的方案,一味地通过强化学习算法中的“利用exploitation”容易陷入局部次优解,而无法得到全局最优解;或者,过多的通过强化学习中的“探索exploration”降低强化学习算法的性能,从而影响对信道接入策略进行优化的效果。因此,如何在“利用”和“探索”中取得平衡,完成对信道接入策略进行优化,成为亟待解决的问题。
技术实现思路
本专利技术实施例的目的在于提供一种信道接入策略的确定方法及装置,用以解决在“利用”和“探索”中取得平衡,完成对信道接入策略进行优化的问题。具体技术方案如下:第一方面,本专利技术实施例提供了一种信道接入策略的确定方法,应用于基站,所述方法包括:在帧的预定时隙内,选择异构频谱池中的信道,所述异构频谱池为异构网络中所有基站共享的包括授权信道和非授权信道的一个异构频谱池;在确定所述基站能够利用所述信道与服务用户之间进行下行数据传输的情况下,将所述信道划分为两个以上子信道,所述服务用户为所述基站所服务的用户设备;确定所述服务用户竞争接入的每个子信道的用户收益值及用户后悔值;在确定每个子信道相邻帧时隙的用户收益值的差值不低于第一门限及所述用户后悔值不低于第二门限的情况下,按照协调所述用户收益值和所述用户后悔值的权重,分别调整所述用户收益值及所述用户后悔值,得到所述基站的累计效应函数值;基于所述累计效应函数值,确定帧的预定时隙的下一时隙内所述基站的信道接入概率,获取下一时隙,更新帧的预定时隙,继续返回执行在帧的预定时隙内,选择异构频谱池中的信道的步骤,直至所述每个子信道相邻帧时隙的用户收益值的差值低于所述第一门限及所述用户后悔值低于所述第二门限,则确定所述服务用户的调度形式及所述服务用户的信道接入策略。进一步的,所述按照协调所述用户收益值和所述用户后悔值的权重,分别调整所述用户收益值及所述用户后悔值,得到所述基站的累计效应函数值,包括:通过如下公式:分别调整所述用户收益值及所述用户后悔值,得到所述基站的累计效应函数值;其中,为所述基站的累计效应函数值,Ak为选择的异构频谱池中基站k的信道,k为基站的序号,为所述异构网络中所有基站,K为所述异构网络中基站的总数,n为基站k的服务用户,为基站k的服务用户的集合,为服务用户的集合,xnk∈{0,1}为服务用户n在基站k下的状态,xnk=0为静默状态,xnk=1为激活状态,N为所述服务用户的总数,为所述服务用户的选择的基站,δ为协调所述用户收益值和所述用户后悔值的权重,为基站k的服务用户n竞争接入基站k的信道Ak的用户收益值,为基站k的服务用户n竞争接入基站k的信道Ak的用户后悔值。进一步的,所述协调所述用户收益值和所述用户后悔值的权重为预设数值;或者,所述协调所述用户收益值和所述用户后悔值的权重是根据δ=1/t确定的,所述δ为协调所述用户收益值和所述用户后悔值的权重,t为预定时隙。进一步的,在所述确定所述服务用户竞争接入的每个子信道的用户收益值及用户后悔值之后,所述方法还包括:在每个子信道相邻帧时隙的用户收益值的差值低于第一门限,并且所述用户后悔值低于第二门限的情况下,则确定所述服务用户的调度形式及所述服务用户的信道接入策略。进一步的,所述确定所述服务用户的调度形式及所述服务用户的信道接入策略,包括:通过如下公式:(A*,N*)=argmaxU(A,N),确定所述服务用户的调度形式及所述服务用户的信道接入策略;其中,(A*,N*)为优化后变量,A*为优化的基站信道选择形式,N*为优化的基站选择形式,argmax(.)为对函数求参数的函数,U(A,N)为所述异构网络中比例公平吞吐量,(A,N)为待优化变量,A为所有基站的一个信道选择形式,N为用户设备对基站的选择形式,argmaxU(A,N)为获取使得吞吐量最大的信道选择形式与基站选择形式;其中,U(A,N)为所述异构网络中比例公平吞吐量,α为公平性指标,k为基站的序号,为所述异构网络中所有基站,K为所述异构网络中基站的总数,为基站k的服务用户n接入信道Ak的数据速率,Ak为基站k的信道选择,k=1,2,...,K,Ak表示集合{A1,A2,...,AK}中的任意元素。第二方面,本专利技术实施例提供了一种信道接入策略的确定装置,应用于基站,所述装置包括:选择模块,用于在帧的预定时隙内,选择异构频谱池中的信道,所述异构频谱池为异构网络中所有基站共享的包括授权信道和非授权信道的一个异构频谱池;划分模块,用于在确定所述基站能够利用所述信道与服务用户之间进行下行数据传输的情况下,将所述信道划分为两个以上子信道,所述服务用户为所述基站所服务的用户设备;第一处理模块,用于确定所述服务用户竞争接入的每个子信道的用户收益值及用户后悔值;调整模块,用于在确定每个子信道相邻帧时隙的用户收益值的差值不低于第一门限及所述用户后悔值不低于第二门限的情况下,按照协调所述用户收益值和所述用户后悔值的权重,分别调整所述用户收益值及所述用户后悔值,得到所述基站的累计效应函数值;第二处理模块,用于基于所述累计效应函数值,确定帧的预定时隙的下一时隙内所述基站的信道接入概率,获取下一时隙,更新帧的预定时隙,继续返回执行在帧的预定时隙内,选择异构频谱池中的信道的步骤,直至所述每个子信道相邻帧时隙的用户收益值的差值低于所述第一门限及所述用户后悔值低于所述第二门限,则确定所述服务用户的调度形式及所述服务用户的信道接入策略。进一步的,所述调整模块,用于:通过如下公式:分别调整所述用户收益值及所述用户后悔值,得到所述基站的累计效应函数值;其中,为所述基站的累计效应函数值,Ak为选择的异构频谱池中基站k的信道,k为基站的序号,为所述异构网络中所有基站,K为所述异构网络中基站的总数,n为基站k的服务用户,为基站k的服务用户的集合,为服务用户的集合,xnk∈{0,1}为服务用户n在基站k下的状态,xnk=0为静默状态,xnk=1为激活状态,N为所述服务用户的总数,为所述服务用户的选择的基站,δ为协调所述用户收益值和所述用户后悔值的权重,为基站k的服务用户n竞争接入基站k的信道Ak的用户收益值,为基站k的服务用户n竞争接入基站k的信道Ak的用户后悔值。进一步的,所述协调所述用户收益值和所述用户后悔值的权重为预设数值;或者,所述协调所述用户收益值本文档来自技高网...

【技术保护点】
1.一种信道接入策略的确定方法,其特征在于,应用于基站,所述方法包括:/n在帧的预定时隙内,选择异构频谱池中的信道,所述异构频谱池为异构网络中所有基站共享的包括授权信道和非授权信道的一个异构频谱池;/n在确定所述基站能够利用所述信道与服务用户之间进行下行数据传输的情况下,将所述信道划分为两个以上子信道,所述服务用户为所述基站所服务的用户设备;/n确定所述服务用户竞争接入的每个子信道的用户收益值及用户后悔值;/n在确定每个子信道相邻帧时隙的用户收益值的差值不低于第一门限及所述用户后悔值不低于第二门限的情况下,按照协调所述用户收益值和所述用户后悔值的权重,分别调整所述用户收益值及所述用户后悔值,得到所述基站的累计效应函数值;/n基于所述累计效应函数值,确定帧的预定时隙的下一时隙内所述基站的信道接入概率,获取下一时隙,更新帧的预定时隙,继续返回执行在帧的预定时隙内,选择异构频谱池中的信道的步骤,直至所述每个子信道相邻帧时隙的用户收益值的差值低于所述第一门限及所述用户后悔值低于所述第二门限,则确定所述服务用户的调度形式及所述服务用户的信道接入策略。/n

【技术特征摘要】
1.一种信道接入策略的确定方法,其特征在于,应用于基站,所述方法包括:
在帧的预定时隙内,选择异构频谱池中的信道,所述异构频谱池为异构网络中所有基站共享的包括授权信道和非授权信道的一个异构频谱池;
在确定所述基站能够利用所述信道与服务用户之间进行下行数据传输的情况下,将所述信道划分为两个以上子信道,所述服务用户为所述基站所服务的用户设备;
确定所述服务用户竞争接入的每个子信道的用户收益值及用户后悔值;
在确定每个子信道相邻帧时隙的用户收益值的差值不低于第一门限及所述用户后悔值不低于第二门限的情况下,按照协调所述用户收益值和所述用户后悔值的权重,分别调整所述用户收益值及所述用户后悔值,得到所述基站的累计效应函数值;
基于所述累计效应函数值,确定帧的预定时隙的下一时隙内所述基站的信道接入概率,获取下一时隙,更新帧的预定时隙,继续返回执行在帧的预定时隙内,选择异构频谱池中的信道的步骤,直至所述每个子信道相邻帧时隙的用户收益值的差值低于所述第一门限及所述用户后悔值低于所述第二门限,则确定所述服务用户的调度形式及所述服务用户的信道接入策略。


2.如权利要求1所述的方法,其特征在于,所述按照协调所述用户收益值和所述用户后悔值的权重,分别调整所述用户收益值及所述用户后悔值,得到所述基站的累计效应函数值,包括:
通过如下公式:

分别调整所述用户收益值及所述用户后悔值,得到所述基站的累计效应函数值;
其中,为所述基站的累计效应函数值,Ak为选择的异构频谱池中基站k的信道,k为基站的序号,为所述异构网络中所有基站,K为所述异构网络中基站的总数,n为基站k的服务用户,为基站k的服务用户的集合,为服务用户的集合,xnk∈{0,1}为服务用户n在基站k下的状态,xnk=0为静默状态,xnk=1为激活状态,N为所述服务用户的总数,为所述服务用户的选择的基站,δ为协调所述用户收益值和所述用户后悔值的权重,为基站k的服务用户n竞争接入基站k的信道Ak的用户收益值,为基站k的服务用户n竞争接入基站k的信道Ak的用户后悔值。


3.如权利要求1或2所述的方法,其特征在于,所述协调所述用户收益值和所述用户后悔值的权重为预设数值;
或者,
所述协调所述用户收益值和所述用户后悔值的权重是根据δ=1/t确定的,所述δ为协调所述用户收益值和所述用户后悔值的权重,t为预定时隙。


4.如权利要求1所述的方法,其特征在于,在所述确定所述服务用户竞争接入的每个子信道的用户收益值及用户后悔值之后,所述方法还包括:
在每个子信道相邻帧时隙的用户收益值的差值低于第一门限,并且所述用户后悔值低于第二门限的情况下,则确定所述服务用户的调度形式及所述服务用户的信道接入策略。


5.如权利要求1或4所述的方法,其特征在于,所述确定所述服务用户的调度形式及所述服务用户的信道接入策略,包括:
通过如下公式:
(A*,N*)=argmaxU(A,N),确定所述服务用户的调度形式及所述服务用户的信道接入策略;
其中,(A*,N*)为优化后变量,A*为优化的基站信道选择形式,N*为优化的基站选择形式,argmax(.)为对函数求参数的函数,U(A,N)为所述异构网络中比例公平吞吐量,(A,N)为待优化变量,A为所有基站的一个信道选择形式,N为用户设备对基站的选择形式,argmaxU(A,N)为获取使得吞吐量最大的信道选择形式与基站选择形式;



其中,U(A,N)为所述异构网络中比例公平吞吐量,α为公平性指标,k为基站的序号,为所述异构网络中所有基站,K为所述异构网络中基站的总数,为基站k的服务用户n接入信道Ak的数据速率,Ak为基站k的信道选择,k=1,2,...,K,Ak表示集合{A1,A2,...,AK}中的任意...

【专利技术属性】
技术研发人员:李斌范超琼鲍士兼许方敏赵成林
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1