【技术实现步骤摘要】
本专利技术属于通信领域,具体涉及一种基于深度强化学习的分布式动态频谱分配方法及其设备。
技术介绍
1、认知无线传感器网络(cognitive wireless sensor network,cwsn)将认知无线电技术与无线传感器网络(wireless sensor network,wsn)结合,通过允许大量的传感器节点作为次级用户(secondary user,su)伺机接入主用户(primary user,pu)的空闲频谱来解决wsn网络的频谱资源稀缺问题。其中,动态频谱接入(dynamic spectrum access,dsa)是cwsn的关键技术之一,其任务是根据认知传感器节点的频谱感知数据做出决策,接入某个已授权给pu的空闲频谱。然而,使用该技术时,需要解决的问题是:如何在伺机接入和使用授权频谱的同时,最大限度地减少对pu的干扰;当多个su尝试接入同一频谱时,怎样避免su之间的冲突。
2、传统的解决方法如博弈论、粒子群优化算法和遗传算法等为解决dsa问题提供了解决方案,这些方法虽然实现了频谱复用,但其模型设计复杂、
...【技术保护点】
1.一种基于深度强化学习的分布式动态频谱分配方法,其特征在于,其用于对认知无线传感器网络中次级用户SU对主用户PU的接入请求进行管理,所述分布式动态频谱分配方法包括如下步骤:
2.如权利要求1所述的基于深度强化学习的分布式动态频谱分配方法,其特征在于:步骤S1的环境模型中,定义认知无线传感器网络中的主用户PU数量为N,次级用户SU的数量为M;则第i个次级用户SUi在信道n上的接收信号的表达式如下:
3.如权利要求2所述的基于深度强化学习的分布式动态频谱分配方法,其特征在于:步骤S2中,构建的马尔可夫决策过程的状态空间O的表达式如下:
【技术特征摘要】
1.一种基于深度强化学习的分布式动态频谱分配方法,其特征在于,其用于对认知无线传感器网络中次级用户su对主用户pu的接入请求进行管理,所述分布式动态频谱分配方法包括如下步骤:
2.如权利要求1所述的基于深度强化学习的分布式动态频谱分配方法,其特征在于:步骤s1的环境模型中,定义认知无线传感器网络中的主用户pu数量为n,次级用户su的数量为m;则第i个次级用户sui在信道n上的接收信号的表达式如下:
3.如权利要求2所述的基于深度强化学习的分布式动态频谱分配方法,其特征在于:步骤s2中,构建的马尔可夫决策过程的状态空间o的表达式如下:
4.如权利要求3所述的基于深度强化学习的分布式动态频谱分配方法,其特征在于:步骤s2中,构建的马尔可夫决策过程的动作空间a的表达式如下:
5.如权利要求4所述的基于深度强化学习的分布式动态频谱分配方法,其特征在于:步骤s2中,构建的马尔可夫决策过程的奖励函数r的表达式如下:
6.如权利要求5所述的基于深度强化学习的分布式动态频谱分配方法,其特征...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。