一种基于频谱开销的预售系统模型及分层学习算法技术方案

技术编号:20550727 阅读:33 留言:0更新日期:2019-03-09 22:57
本发明专利技术公开了一种基于频谱开销的预售系统模型及分层学习算法。该模型为:频谱管理者通过向用户出售资源收取报酬而获得收益,通过预售机制,来减小用户需求不确定性造成的影响,提升频谱资源管理者和用户双方的收益。算法为:构建多用户分层博弈,参与者是频谱管理者与各用户;用户随机选择一个邻居联盟加入,计算自身期望效用,比较用户加入联盟前和加入联盟后的效用函数,选择较优解加入,形成稳定联盟结构;联盟向频谱管理者预购频谱资源,频谱管理者更新资源预备量;循环迭代,直至用户间形成稳定联盟。本发明专利技术有效提升了频谱管理者与用户的直接收益。

A Pre-sale System Model and Hierarchical Learning Algorithms Based on Spectrum Overhead

The invention discloses a pre-sale system model based on spectrum overhead and a hierarchical learning algorithm. The model is as follows: spectrum managers gain revenue by selling resources to users, and through the pre-sale mechanism, to reduce the impact of user demand uncertainty and enhance the benefits of both spectrum resource managers and users. The algorithm is as follows: building multi-user hierarchical game, the participants are spectrum managers and users; users randomly select a neighbor alliance to join, calculate their expected utility, compare the utility functions of users before and after joining the alliance, select the better solution to join, and form a stable alliance structure; alliance preorders spectrum resources from spectrum managers, and spectrum managers update the resource preparation. Quantity; iterate iteratively until a stable alliance is formed between users. The invention effectively improves the direct benefits of spectrum managers and users.

【技术实现步骤摘要】
一种基于频谱开销的预售系统模型及分层学习算法
本专利技术属于无线通信
,特别是一种基于频谱开销的预售系统模型及分层学习算法。
技术介绍
随着无线技术的发展与业务流量的增加,无线频谱资源短缺已成为新技术发展的瓶颈问题。针对这个问题,目前相关研究主要集中于用户报价的频谱资源收益最大化与用户需求的资源配置最优(参考文献1:P.Si,H.Ji,F.YuandV.C.MLeung,“OptimalCooperativeInternetworkSpectrumSharingforCognitiveRadioSystemsWithSpectrumPooling,”inIEEETransactionsonVehicularTechnology,vol.59,no.4,pp.1760–1768,2010.)。在相关的研究中,对频谱资源池机制的关注较少。频谱资源池是实现频谱资源复用和提高频谱利用率的一种频谱资源管理机制(参考文2:T.A.WeissandF.K.Jondral,“SpectrumPooling:AnInnovativeStrategyfortheEnhancementofSpectrumEfficiency,”inIEEERadioonCommunications,2004.),其主要特点是频谱资源管理者,即卖方,对频谱资源进行维护,当用户有通信需求时,通过支付一定的代价获得频谱授权,进而接入信道发送数据,用户需求得到满足,频谱资源实现收益。在传统的资源池模式中,用户在有需求后随时提出频谱资源的需求,卖方立刻为其提供服务。这种“立等即取”的资源使用模式,虽然极大地满足了用户需求的实时性,但却降低了频谱资源利用率,减少了市场的频谱资源收益。能量团购相关文献(参考文献3:J.Xu,L.DuanandR.Zhang,“EnergyGroupBuyingWithLoadingSharingforGreenCellularNetworks,”inIEEEJournalonSelectedAreasinCommunications,vol.34,no.4,pp.786–799,2015.)提出的方案可以优化能量利用率,但该文献针对的是能量团购问题,并没有转化到频谱问题中。
技术实现思路
本专利技术的目的在于提供一种高效的基于频谱开销的预售系统模型及分层学习算法,以提高频谱管理者与用户的直接收益。实现本专利技术目的的技术解决方案为:一种基于频谱开销的预售系统模型,对该模型做如下刻画:频谱管理者对频谱资源池进行维护,通过向用户出售资源收取报酬而获得收益;采用预售机制,利用时间维度频谱资源获取代价的差异性。一种基于频谱开销的预售系统分层学习算法,包括以下步骤:步骤1,将联盟选择与资源预购问题建模为多用户分层博弈,博弈的参与者是频谱管理者与各用户;步骤2,定义频谱管理者和用户的效用函数,用户间完成邻居发现过程,建立邻居联盟集合;步骤3,用户随机选择一个邻居联盟加入,各用户在联盟内资源共享的情况下,计算自身期望效用;步骤4,基于帕累托准则,比较用户加入联盟前和加入联盟后的效用函数,选择较优解加入,形成稳定联盟结构;步骤5,联盟向频谱管理者预购频谱资源,频谱管理者更新资源预备量;步骤6,循环步骤3~步骤5,直到用户间形成稳定联盟。进一步地,步骤1所述的将联盟选择与资源预购问题建模为多用户分层博弈,博弈模型定义为:其中,包含七个组成部分,m为频谱管理者,为参与博弈的用户集合,an为用户n的联盟选择,为用户n的预购量,mp为频谱管理者的提前准备量,v为频谱管理者的效用函数,un为用户n的效用函数;设定提前准备的频谱资源代价为β0,临时调度的频谱资源代价为β1,有β0≤β1;设定频谱资源的预售定价为α0,最终价格为α1,有α0≤α1;用户传输单位需求获得的收益为γ,用户的最终真实数据需求为srn;博弈优化目标P为:进一步地,步骤2中所述的定义频谱管理者和用户的效用函数,具体如下:当联盟成员的总需求量大于联盟的总预购量时,先将部分用户满足完自身需求之后,剩余的需求量根据剩余用户的需求量按照比例分配,此时,用户的效用函数un为:其中,为用户的最终真实数据需求、α0为频谱资源的预售定价、为用户n的预购量、γ为用户传输单位需求获得的收益、an为用户n的联盟选择;Δpos(an)为联盟中预购量大于需求量时用户剩余频谱资源之和,Δneg(an)为联盟中预购量小于需求量时用户所缺频谱资源之和,为用户n按照比例分得的联盟剩余预购资源,为需要向频谱管理者临时购买的资源;当联盟成员的总需求量小于联盟成员的总预购量之时,剩余的频谱资源由联盟成员按照各自需求进行等比例分担,此时,用户的效用函数un为:其中为用户剩余的资源通过联盟内二次消化后带来的回报;频谱资源管理者的效用函数为:其中,β0为提前准备的频谱资源代价,β1为临时调度的频谱资源代价,α0为频谱资源的预售定价,α1为频谱资源的最终价格,Δneg(an)为联盟中预购小于需求的用户所缺频谱资源之和,Δpos(an)为联盟中预购大于需求的用户剩余频谱资源之和;X为满足条件的联盟集合,也即无法通过联盟内部资源二次分配来满足其效用的联盟集合;为X中的联盟对应的临时频谱资源请求收益,当频谱管理者准备充足时,X中的联盟请求直接进行服务,否则需要通过临时调用资源来进行服务;为预售收益减去预备量开销的部分;即为临时调用资源满足额外需求所获得的收益。进一步地,步骤4所述的基于帕累托准则,比较用户加入联盟前和加入联盟后的效用函数,选择较优解加入,形成稳定联盟结构,具体如下:对于任一用户n和两个联盟CO,CO',基于帕累托准则定义如下动作:当用户遵循帕累托准则时,在从一个联盟转移到另一个联盟的过程中,离开联盟的成员和加入联盟的成员的效用函数都不减小,即对于任一用户n的两个联盟选择稳定联盟结构定义如下:即当一个联盟结构(an,a-n)是稳定的,当且仅当在遵循优选准则的情况下,每一个用户n都不能通过加入、离开动作来提升其效用函数。进一步地,步骤6所述的循环步骤3~步骤5,直到用户间形成稳定联盟,具体如下:步骤6.1、频谱管理者更新预售价格;步骤6.2、用户在当前市场价格下,基于单用户模型确定最优预购策略,根据自身需求的分布,计算其预期的实际收益;步骤6.3、用户随机选择一个邻居联盟加入,联盟内进行信息交互,各用户在联盟内资源共享的情况下,计算自身期望效用;步骤6.4、基于帕累托准则,比较用户加入联盟前和加入联盟后的效用函数,选择较优解加入;联盟向频谱管理者预购频谱资源,频谱管理者更新资源预备量;步骤6.5、在业务需求达到后,用户进行信息传输和联盟内均衡。本专利技术与现有技术相比,其显著优点在于:(1)采用频谱资源的分级准备机制,减少了用户需求不确定性的影响,避免了频谱资源潜在的浪费;(2)利用Stackerlberg博弈对问题进行建模,通过联盟形成博弈推导了均衡的存在性,为算法的设计提供了理论支持;(3)设计了基于频谱开销的预售系统分层学习算法,提升了频谱管理者与用户的直接收益。附图说明图1是本专利技术基于频谱开销的预售系统模型中的频谱预售机制示意图。图2是本专利技术中联盟内用户间合作方式示意图。图3是本专利技术实施例中不同场景下用户数目本文档来自技高网
...

【技术保护点】
1.一种基于频谱开销的预售系统模型,其特征在于,对该模型做如下刻画:频谱管理者对频谱资源池进行维护,通过向用户出售资源收取报酬而获得收益;采用预售机制,利用时间维度频谱资源获取代价的差异性。

【技术特征摘要】
1.一种基于频谱开销的预售系统模型,其特征在于,对该模型做如下刻画:频谱管理者对频谱资源池进行维护,通过向用户出售资源收取报酬而获得收益;采用预售机制,利用时间维度频谱资源获取代价的差异性。2.一种基于频谱开销的预售系统分层学习算法,其特征在于,包括以下步骤:步骤1,将联盟选择与资源预购问题建模为多用户分层博弈,博弈的参与者是频谱管理者与各用户;步骤2,定义频谱管理者和用户的效用函数,用户间完成邻居发现过程,建立邻居联盟集合;步骤3,用户随机选择一个邻居联盟加入,各用户在联盟内资源共享的情况下,计算自身期望效用;步骤4,基于帕累托准则,比较用户加入联盟前和加入联盟后的效用函数,选择较优解加入,形成稳定联盟结构;步骤5,联盟向频谱管理者预购频谱资源,频谱管理者更新资源预备量;步骤6,循环步骤3~步骤5,直到用户间形成稳定联盟。3.根据权利要求2所述的基于频谱开销的预售系统分层学习算法,其特征在于,步骤1所述的将联盟选择与资源预购问题建模为多用户分层博弈,博弈模型定义为:其中,包含七个组成部分,m为频谱管理者,为参与博弈的用户集合,an为用户n的联盟选择,为用户n的预购量,mp为频谱管理者的提前准备量,v为频谱管理者的效用函数,un为用户n的效用函数;设定提前准备的频谱资源代价为β0,临时调度的频谱资源代价为β1,有β0≤β1;设定频谱资源的预售定价为α0,最终价格为α1,有α0≤α1;用户传输单位需求获得的收益为γ,用户的最终真实数据需求为博弈优化目标P为:4.根据权利要求2所述的基于频谱开销的预售系统分层学习算法,其特征在于,步骤2中所述的定义频谱管理者和用户的效用函数,具体如下:当联盟成员的总需求量大于联盟的总预购量时,先将部分用户满足完自身需求之后,剩余的需求量根据剩余用户的需求量按照比例分配,此时,用户的效用函数un为:其中,为用户的最终真实数据需求、α0为频谱资源的预售定价、为用户n的预购量、γ为用户传输单位需求获得的收益、an为用户n的联盟选择;Δpos(an)为联盟中预购量大于需求量时用户剩余频谱资源之和,Δneg(an)为联盟中预购量小于需求量时用户所缺频谱资源之和,为用户n按照比例分得的联盟剩余预购资源,为需要向频谱管理者临时购买的...

【专利技术属性】
技术研发人员:王金龙陈瑾徐煜华白韡张玉立江汉
申请(专利权)人:中国人民解放军陆军工程大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1