一种基于Stackelberg博弈的多频段群智频谱感知方法技术

技术编号:35022233 阅读:10 留言:0更新日期:2022-09-24 22:52
本发明专利技术公开了一种基于Stackelberg博弈的多频段群智频谱感知方法,将感知需求次用户向协作感知次用户支付报酬问题建模为博弈模型,其中前者是领导层,后者是从属层。感知需求次用户发布频段感知任务与初始报酬,各协作感知次用户通过优化感知时间使自身效用最优并将感知数据发送给感知需求次用户,感知需求次用户不断更新报酬使效用最优并得到最终判决结果。本发明专利技术在领导层博弈中综合考虑检测概率和报酬定义了感知需求次用户效用,通过博弈优化报酬获得最佳效用,从属层博弈中综合考虑检测概率和感知时间定义了协作感知次用户效用,根据感知需求次用户发布报酬优化感知时间以获得最佳效用,推导证明了感知时间的优化存在纳什均衡。什均衡。什均衡。

【技术实现步骤摘要】
一种基于Stackelberg博弈的多频段群智频谱感知方法


[0001]本专利技术属于通信
,具体涉及一种基于Stackelberg博弈的多频段群智频谱感知方法。

技术介绍

[0002]随着智能终端设备的急剧增加,频谱资源日益紧缺,认知无线电技术(Cognitive Radio,CR)可以通过频谱共享大大提高频谱利用率,频谱感知是认知无线电技术的重要环节。频谱空洞是指授权用户(AuthorizedUser,AU)合法使用但未被占用的空闲频段,认知无线电可以将次用户(Second User,SU)机会接入到频谱空洞,但要想实现空闲频谱资源的接入,通过频谱感知技术检测确认授权用户是否存在这一过程尤为重要。
[0003]次用户频谱感知通常采用能量检测法,不需要知道授权用户的先验知识,通过计算频段积累的能量是否超过门限值来判断授权用户是否存在。然而面对无线环境中阴影效应、多径衰落、噪声不确定等不利因素的影响,单个次用户对授权频段的感知结果往往是不可靠的,而多个次用户协作频谱感知性能优于单个次用户的感知性能,因此通常采用多个次用户协作频谱感知。关于多用户协作频谱感知的许多研究都是默认次用户无偿感知授权用户是否存在,这在生活中是不现实的,因为次用户在感知过程中会消耗时间、能量、内存等计算资源,所以多用户感知结果虽然更准确,但次用户可能不愿意无偿参与频谱感知过程。因此将激励机制引入频谱感知可以有效解决这一问题,激励机制通过支付报酬的方式补偿次用户的成本,鼓励他们积极参与协作频谱感知。
[0004]文献[10]提出了一种基于SU分类的协作频谱感知算法,引入激励机制来鼓励更多的SU积极参与检测,该算法根据信道条件将次用户分为普通次用户(OSU)和中继次用户(RSU),首先每个SU通过计算效用函数决定是否参与,然后OSU将检测到的数据发送给附近的RSU,接着RSU将收到的数据与本地检测数据一同传送给融合中心。
[0005]上述研究只针对单个频段进行频谱感知,在实际系统中,往往需要占用多个频段,并且该研究没有考虑次用户感知成本优化问题,造成感知代价较大。本专利技术将群智感知技术引入到频谱感知中,考虑多频段的场景,提出了一种基于Stackelberg博弈的多频段群智频谱感知方法,通过优化感知时间减少协作感知次用户的感知成本。
[0006][10]LI Peijun,HAN Bo,LI Heng,et al.The research of spectrum sensing based on SU classification in cognitive LTE

A network[C]//2019IEEE 3rd Information Technology,Networking,Electronic andAutomation Control Conference,Chengdu,China.IEEE,2019:1917

1921.

技术实现思路

[0007]本专利技术的目的在于克服现有技术感知单个频段的缺陷,提供一种基于Stackelberg博弈的多频段群智频谱感知方法,通过领导层感知需求次用户和从属层协作感知次用户各自博弈,为感知需求次用户招募到合适的协作感知次用户完成感知任务,提
高协作感知积极性,在博弈过程中优化协作感知次用户感知时间节约感知成本,提高感知性能。
[0008]为解决上述技术问题,本专利技术采用以下技术方案。
[0009]一种基于Stackelberg博弈的多频段群智频谱感知方法,将感知需求次用户向协作感知次用户支付报酬的问题建模为Stackelberg博弈系统模型,其中感知需求次用户是博弈模型中的领导层,协作感知次用户是博弈模型中的从属层;所述系统的场景是一个圆形区域,随机分布有N个协作感知次用户和M个感知需求次用户,取M=2,即存在两个感知需求次用户;所述的感知需求次用户的集合,表示为所述的协作感知次用户的集合表示为
[0010]所述方法包括以下步骤:
[0011]Step1、构建从属层优化问题,并推导协作感知次用户博弈存在纳什均衡解:综合考虑检测概率、感知时间定义协作感知次用户的效用函数,使协作感知次用户的效用最大化;
[0012]Step2、构建领导层优化问题:综合考虑经表决融合后的检测概率和任务报酬定义了感知需求次用户的效用函数,使感知需求次用户的效用最大化;
[0013]Step3、将感知需求次用户向协作感知次用户支付报酬的问题构建成基于Stackelberg博弈的多频段群智频谱感知系统模型,在博弈模型中感知需求次用户是领导层,协作感知次用户是从属层,每个协作感知次用户可以感知所有频段,但同时只能感知一个频段;
[0014]Step4、感知需求次用户对于要感知的频段向协作感知次用户发布任务及初始报酬,初始化感知需求次用户的最大效用为0;
[0015]Step5、所有协作感知次用户根据报酬及感知时间计算其在当前报酬下的效用,通过优化感知时间选择效用最大时对应的感知时间,协作感知次用户根据该感知时间计算对应的检测概率与成本,并将数据对(感知时间,检测概率,基于成本产生的报价)传送给感知需求次用户;
[0016]Step6、感知需求次用户根据其报酬向检测概率高的协作感知次用户发送招募意愿及支付报酬的价格;
[0017]Step7、若协作感知次用户被多个感知需求次用户同时招募时,通过比较多个感知需求次用户提供的价格选择能够获得报酬多的感知任务加入;
[0018]Step8、感知需求次用户计算在当前报酬下的效用,如果该效用值高于则将该报酬记录下来,在最大报酬B
max
的限制下以步长μ增加报酬值,发布新的报酬并重复Step5

Step8,直到相邻两次感知需求次用户的效用值误差小于δ;
[0019]Step9、将Step8中得到的感知需求次用户效用最优时对应的报酬作为最终的报酬,协作感知次用户根据该报酬确定最终的感知时间并将感知数据上传给感知需求次用户,得到最终的判决结果。
[0020]具体的,协作感知次用户的报酬p
ij
为:
[0021][0022]其中表示协作感知次用户i感知频段任务j的检测概率,B
j
表示感知需求次用户j发布的报酬,T
j
表示参与频段感知任务j的协作次用户集合。
[0023]具体的,协作感知次用户的成本c
ij
为:
[0024]c
ij
=β
×
t
ij

×
d
ij
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0025]其中β和γ表示加权系数,t
ij
表示协作感知次用户i感知频段任务j的感知时间,d
ij
表示协作感知次用户i和感知需求次用户j之本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Stackelberg博弈的多频段群智频谱感知方法,其特征在于,将感知需求次用户向协作感知次用户支付报酬的问题建模为Stackelberg博弈系统模型,其中感知需求次用户是博弈模型中的领导层,协作感知次用户是博弈模型中的从属层;所述系统的场景是一个圆形区域,随机分布有N个协作感知次用户和M个感知需求次用户,取M=2,即存在两个感知需求次用户;所述的感知需求次用户的集合,表示为所述的协作感知次用户的集合表示为所述方法包括以下步骤:Step1、构建从属层优化问题,并推导协作感知次用户博弈存在纳什均衡解:综合考虑检测概率、感知时间定义协作感知次用户的效用函数,使协作感知次用户的效用最大化;Step2、构建领导层优化问题:综合考虑经表决融合后的检测概率和任务报酬定义了感知需求次用户的效用函数,使感知需求次用户的效用最大化;Step3、将感知需求次用户向协作感知次用户支付报酬的问题构建成基于Stackelberg博弈的多频段群智频谱感知系统模型,在博弈模型中感知需求次用户是领导层,协作感知次用户是从属层,每个协作感知次用户可以感知所有频段,但同时只能感知一个频段;Step4、感知需求次用户对于要感知的频段向协作感知次用户发布任务及初始报酬,初始化感知需求次用户的最大效用为0;Step5、所有协作感知次用户根据报酬及感知时间计算其在当前报酬下的效用,通过优化感知时间选择效用最大时对应的感知时间,协作感知次用户根据该感知时间计算对应的检测概率与成本,并将数据对(感知时间,检测概率,基于成本产生的报价)传送给感知需求次用户;Step6、感知需求次用户根据其报酬向检测概率高的协作感知次用户发送招募意愿及支付报酬的价格;Step7、若协作感知次用户被多个感知需求次用户同时招募时,通过比较多个感知需求次用户提供的价格选择能够获得报酬多的感知任务加入;Step8、感知需求次用户计算在当前报酬下的效用,如果该效用值高于则将该报酬记录下来,在最大报酬B
max
的限制下以步长μ增加报酬值,发布新的报酬并重复Step5

Step8,直到相邻两次感知需求次用户的效用值误差小于δ;Step9、将Step8中得到的感知需求次用户效用最优时对应的报酬作为最终的报酬,协作感知次用户根据该报酬确定最终的感知时间并将感知数据上传给感知需求次用户,得到最终的判决结果。2.根据权利要求1所述的一种基于Stackelberg博弈的多频段群智频谱感知方法,其特征在于,协作感知次用户的报酬p
ij
为:其中表示协作感知次用户i感知频段任务j的检测概率,B
j
表示感知需求次用户j发布的报酬,T
j
表示参与频段感知任务j的协作次用户集合。3.根据权利要求1所述的一种基于Stackelberg博弈的多频段...

【专利技术属性】
技术研发人员:朱琦郭晓敏
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1