一种基于改进强化学习的集中式认知无线电频谱分配方法组成比例

技术编号：19435891 阅读：68 留言：0更新日期：2018-11-14 12:59

本发明专利技术涉及一种基于改进强化学习的集中式认知无线电频谱分配方法，包括：收集不同的认知用户感知数据，得到认知环境的状态信息；分析信道状态模型和调制方式对传输功率和误码率的影响；设定误码率门限标准约束为强化学习算法的奖励函数，当选择的动作适应于当前状态时给予激励正值，否则给予惩罚负值，构建强化学习算法模型；利用改进强化学习算法动态地分配频谱资源，即在执行算法时需要结合案例历史信息和自适应的贪心算子。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进强化学习的集中式认知无线电频谱分配方法
本专利技术属于认知无线电频谱分配领域，涉及利用结合案例的改进强化学习算法来解决系统信道和调制方式的自适应决策方法。
技术介绍
随着认知无线通信技术的飞速发展，为了更好的解决有限频谱的高效利用，结合新兴的智能学习算法于认知无线电当中称为研究热点。能够通过对认知环境的合理分析和推理，从频率、时间、空间等方面，根据不同的认知通信需求，提高某一方面的性能或者综合多个目标提高频谱效率。频谱分配策略根据不同的划分方法可以分为多种，比如静态和动态频谱分配策略，集中式和分布式频谱分配策略，合作式和竞争式频谱分配策略等。其中按照网络结构分类的集中和分布是策略的区别在于是否由中心控制器来管理和协调认知用户对空闲频谱的使用。在集中式管理系统中，首先需要中心对认知用户感知结果的一个信息收集和处理，然后根据认知用户的需求分配频谱和认知参数。分布式频谱分配策略，则不需要中心控制器，依靠认知本地感知信息和与协作交互信息确定空闲频谱状态，进而进行频谱共享策略。智能学习一般分为在线学习和离线学习两种方法，离线是基于大量的案例数据挖掘，从而获得一定...

【技术保护点】
1.一种基于改进强化学习的集中式认知无线电频谱分配方法，包括下列步骤：1)中心控制器收集不同的认知用户感知数据，得到认知环境的状态信息，设有M个信道，设定信道状态s为si∈S＝{(s1,s2,…,sC)}，i代表当前帧，S为状态空间，信道状态有C＝2^M种，信道不可用时sc记为0，信道可用时则不同的状态对应不同的信噪比值，并据此给出信道状态转移概率的表达形式；2)分析信道状态模型和调制方式对传输功率和误码率的影响，设定动作信息为ai∈A＝{(am,ad)|m∈{1,2,…,M},d∈{0,1,2,…,D}}，A表示动作空间，am表示选择的信道，ad表示选择的调制模式，D表示调制阶数；假设每次只...

【技术特征摘要】
1.一种基于改进强化学习的集中式认知无线电频谱分配方法，包括下列步骤：1)中心控制器收集不同的认知用户感知数据，得到认知环境的状态信息，设有M个信道，设定信道状态s为si∈S＝{(s1,s2,…,sC)}，i代表当前帧，S为状态空间，信道状态有C＝2^M种，信道不可用时sc记为0，信道可用时则不同的状态对应不同的信噪比值，并据此给出信道状态转移概率的表达形式；2)分析信道状态模型和调制方式对传输功率和误码率的影响，设定动作信息为ai∈A＝{(am,ad)|m∈{1,2,…,M},d∈{0,1,2,…,D}}，A表示动作空间，am表示选择的信道，ad表示选择的调制模式，D表示调制阶数；假设每次只选择一个信道进行数据传输，在给定信道状态和调制方式下，给出为达到目标误码率所需要的最小传输功率要求；3)结合步骤1和步...

【专利技术属性】
技术研发人员：马永涛，朱芮，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人