一种快速收敛的最优信道选择方法技术

技术编号:25762553 阅读:61 留言:0更新日期:2020-09-25 21:10
本发明专利技术公开了一种快速收敛的最优信道选择方法,涉及认知无线电技术领域,包括以下步骤:首先建立基于G‑E马尔可夫信道的状态转移模型,根据该模型得到每个时隙下的信道状态;然后将最优信道的选择问题定义为机器学习中的MAB问题,将每个信道视为MAB中的一个臂,根据每个臂的收益回报值的不同,统计出当前最优信道。在接下来的迭代学习过程中,创新地加入了基于状态统计的信道置信因子以及E‑E平衡系数,由此计算出最大置信上界g′去更新各个臂的收益回报;循环往复,直到收敛到最优信道,本发明专利技术能够解决多个感知信道共存时系统的快速收敛和精确信道选择问题。

【技术实现步骤摘要】
一种快速收敛的最优信道选择方法
本专利技术涉及认知无线电
,具体为一种快速收敛的最优信道选择方法。
技术介绍
随着无线通信业务的快速发展,无线传感网络得到了广泛应用,如智能家居、智慧城市、环境监测等领域。无线传感网络由大量的微传感器节点组成,其间使用开放频段进行通信,如ISM(IndustrialScientificMedical)频段。然而,随着开放设备不断增加,网络严重拥塞,通信的可靠性难以得到保障,从而严重影响无线传感网络的持续发展,在多个认知无线信道共存的情况下,准确快速地收敛到最优信道是认知无线传感器网络(CognitiveRadioSensorNetwork,CRSN)面临的一个挑战,传统的无线信道选择方法可以实现最优信道选择问题。但由于计算量大、时间积累大,其收敛速度达不到要求。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种快速收敛的最优信道选择方法。本专利技术的目的是通过以下技术方案来实现的:一种快速收敛的最优信道选择方法,包括以下步骤;S1,建立基于G-E马尔本文档来自技高网...

【技术保护点】
1.一种快速收敛的最优信道选择方法,其特征在于,包括以下步骤;/nS1,建立基于G-E马尔可夫信道的状态转移模型,为每个信道的每个时隙生成G-E信道状态,将每个信道定义为一个臂;/nS2,对每个臂访问一次,获得每个臂的初始奖励值;/nS3,选择当前最优臂并计算其平均收益;/nS4,采用基于状态统计信息而构建的新的g’去更新最优臂的置信上界;/nS5,重复步骤S2,S3与S4,直到收敛到最优信道。/n

【技术特征摘要】
1.一种快速收敛的最优信道选择方法,其特征在于,包括以下步骤;
S1,建立基于G-E马尔可夫信道的状态转移模型,为每个信道的每个时隙生成G-E信道状态,将每个信道定义为一个臂;
S2,对每个臂访问一次,获得每个臂的初始奖励值;
S3,选择当前最优臂并计算其平均收益;
S4,采用基于状态统计信息而构建的新的g’去更新最优臂的置信上界;
S5,重复步骤S2,S3与S4,直到收敛到最优信道。


2.根据权利要求1所述的一种快速收敛的最优信道选择方法,其特征在于,所述步骤S1中的G-E马尔可夫信道的状态有两种,忙用0表示和闲用1表示,有限状态空间定义为S={0,1}。


3.根据权利要求2所述的一种快速收敛的最优信道选择方法,其特征在于,所述状态转移模型中的授权信道状态转移概率矩阵以及状态分布表示为:






其中,λ0和λ1是信道信念值的边界,信道是正相关,即λ0≤λ1,基于G-E马尔可夫特性,系统的下一个状态可基于当前状态由转移概率计算得出。


4.根据权利要求3所述的一种快速收敛的最优信道选择方法,其特征在于,所述步骤S2中的最优臂的平均收益通过以下公式计算:设在n个时隙之后,选择了第i个信道Ti(n)次,那么初始奖励值的平均值可以表示为:



其中,χi(t)是时隙t处选择信道i获得的实际的初始奖励值。


5.根据权利要求4所述的一种快速收敛的最优信道选择方法,其特征在于,所述



当信道状态为忙时,传输将失败,则系统回报为Rc<0的惩罚,当信道状态为空闲时,传输将成功,并给予Rr>0的初始奖励值。


6.根据权利要求5所述的一种快速收敛的最优...

【专利技术属性】
技术研发人员:陈春梅杨世恩蒋和松
申请(专利权)人:西南科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1