当前位置: 首页 > 专利查询>厦门大学专利>正文

一种提升水声通信链路平均吞吐量的方法技术

技术编号:24945432 阅读:40 留言:0更新日期:2020-07-17 22:43
一种提升水声通信链路平均吞吐量的方法,涉及水声通信网络优化。首先,将水声通信网络中的某一单链路看成独立的Agent,以及该链路上所有可能的传输频率和传输速率组合看成arm,将此二维图建立成具有单峰特性的无向图G;接着,将该链路平均吞吐量最大化问题建模成具有随机性质的MAB问题;然后,利用改进的UTS算法对其进行求解,得到该链路上最佳的传输频率和传输速率组合;最后,该链路保持该设置直到下一次更新时刻为止。考虑了具有二维单峰结构的水声通信目标函数,有效利用了水声通信信道的特性,并大大减少了每个时隙探索的arm空间;且运用了随机打破限制操作,不依赖于问题的条件。大大提高了网络平均吞吐量。

【技术实现步骤摘要】
一种提升水声通信链路平均吞吐量的方法
本专利技术涉及水声通信网络优化,尤其是涉及基于汤普森采样算法,并利用单峰性质来选择链路最佳传输频率和传输速率的一种提升水声通信链路平均吞吐量的方法。
技术介绍
近年来,水声通信技术在环境监测、矿产开发、海洋生态系统调查等领域得到了广泛应用,并越来越受到人们的重视。然而,与无线电波通信相比,水声通信面临着复杂水下环境、传播时延长和频率依赖性衰减等挑战。在已有方法中,水声通信的问题大都可以归结为通过数学建模,优化求解得到最优的传输参数,如速率选择、频率选择、中继配置等问题。然而,水声环境时刻变化,信道模型也随之变化,基于传统的优化方法和线下算法已经无法满足当前需要。因此,水声通信中的关键问题之一是如何在没有信道模型信息的情况下使得网络的实时性能最佳。针对点对点水声通信网络,本专利技术拟通过调节各链路上的传输频率和传输速率,来有效提高该链路的平均吞吐量。选择调节传输频率和传输速率的原因是:一方面,在固定传输距离的前提下,存在一个最优传输频率使得该链路的接收信噪比(SNR)最大;另一方面,在固定信噪比的前提下,调节传输速率,会改变信道传输的成功率,从而改变该链路的吞吐量。由此可以看出,在传输中,改变传输频率和传输速率并非两个独立的时间,传输频率和传输速率共同决定传输成功的概率。目前现有技术大多只考虑一个方面,并且多为线下的分析统计方式,依赖于水声信道模型,应用到实际水声信道中缺乏合理性和鲁棒性,存在用时过长和无法实时更新等问题。为解决以上问题,有些文献采用机器学习的方法来为单链路寻找最佳的传输频率和传输速率组合,从而提高网络吞吐量。多臂老虎机算法MAB是一种序贯决策问题,也是一种最基本的强化学习方法,即在给定一个有限资源集合的情况下,用户Agent需要在最短的时隙内找到最佳的选项,从而使其长期奖励最大化。其特点是Agent在每个时隙都需要进行利用(Exploitation)和探索(Exploration)的权衡。常见的MAB问题可以分成三类:随机性MAB,对抗性MAB和马尔科夫MAB。本专利技术考虑具有随机性的MAB问题,其中Agent(即水声通信中某一单链路)的目标是寻找最优的arm(即关于传输频率和传输速率的组合)来最大化其自身的奖励。为解决该问题,本专利技术提出了一种基于汤普森采样算法和文献(S.Paladino,F.trovò,M.Restelli,andN.Gatti,“UnimodalThompsonsamplingforgraphstructuredarms,”arXivpreprintarXiv:1611.05724v2,Nov.2016.)的改进算法,即UTS(UnimodalThompsonSampling)算法。与传统的汤普森采样算法(YanLiang,“Low-ComplexitySemidefiniteRelaxationDetectorforOFDMSystemsinFastTime-VaryingWirelessChannels,”SpringerNewYork,2012.)相比,它具有以下特征。第一,改进的UTS算法考虑具有二维单峰特性的水声通信目标函数,并与跟随leader算法相结合,大大减少了每个时隙需要遍历的臂的数目,从而减少运行时间和存储空间。第二,改进的UTS算法加入了随机打破限制(tiesbrokenarbitrarily)操作,可以保证算法的收敛性、且不受信道初始参数的影响。
技术实现思路
本专利技术的目的在于针对现有机器学习方法存在的实现复杂度较高和训练时间长的特点,以及水声通信网络中存在的如何通过调节单链路的传输频率和传输速率来提升该链路平均吞吐量等问题,提供一种提升水声通信链路平均吞吐量的方法。本专利技术包括以下步骤:1)初始化算法参数,并输入算法的先验信息;2)采用随机打破限制,找到整个图G上具有最大奖励均值的arm,确定leader;3)遍历leader周边及自身,并计算各自的瞬时成功率;4)根据步骤3)所得出的瞬时成功率,计算出对应的实时吞吐量,选取具有最大吞吐量的arm,并观察收益;5)更新被执行arm的各参数值,包括执行次数、传输成功次数和传输失败次数;6)更新执行的时隙数t,即t=t+1,若t<T,则回到步骤3;若t=T,则结束,并返回该链路最佳的传输频率和传输速率组合;其中,T为总的时隙数。在步骤1)中,所述初始化算法参数,并输入算法的先验信息的具体方法可为:在环境相对稳定的水声通信中,某一单链路有m个传输频率和n个传输速率可供选择,其中m>2,n>2,即一共有m×n个arm,则图G上一共有m×n个点;假设该单链路上的先验信息为所有arms的奖励均值和所有arms被选择的次数,且起始值均为零,即奖励均值起始值所有arm被选择的次数起始值假设算法的总时隙数为T。在步骤2)中,所述确定leader的具体方法可为:通过查看整个图G所有点的奖励均值找出具有最大均值所对应的arm,作为leaderL(t);由于所有arms上的均值初始值相等,所以在开始的一段时间内,在整个图G中可以存在多个leader,Agent随机地在leader集合中选取leader。在步骤3)中,所述遍历leader周边及自己,并计算各自的瞬时成功率的具体方法可为:遍历leader在图G周围距离自身一个单位的arm以及自身,计算它们的瞬时成功率;由于每个arm的瞬时成功率服从贝塔分布,即θi,j~Beta(αi,j+1,βi,j+1),其中αi,j表示执行此arm(第i个传输频率和第j个传输速率对)传输成功的次数,βi,j表示执行此arm传输失败的次数。在步骤4)中,所述观察收益的具体方法可为:被执行arm记为其中,为被执行arm;ra是arma对应的传输速率;选中被执行arm后,链路将以对应的传输频率或传输速率进行传输,根据实际水声通信信道的状态,可以观察到一个随机反馈的关于该被执行arm的收益,记为且在步骤5)中,所述更新被执行arm的各参数值的具体方法可为:在时隙t中arma的样本平均吞吐量为为了减少系统储存内存,引入增量实现incrementalimplementation形式,即:其中,Da(t)是到时隙t为止执行arma的次数,且由该式可看出,只需要上一个时隙arma的样本平均吞吐量和上一个时隙arma执行次数Da(t-1)的储存量,便可以得到当前时隙arma的样本平均吞吐量;更新的执行次数,即根据返回的的值判断传输成功与否,若则传输成功,的传输成功次数加1;若则传输失败,的传输失败次数加1。本专利技术克服现有机器学习方法存在的实现复杂度较高和训练时间长的特点,采用随机性多臂老虎机(multi-armedbandit,MAB)框架来对该网络吞吐量最大化问题进行建模,并与跟随leader(followingtheleader)算法相结合进而求解得到该链路最佳的传输频率和传输速率组合。与现有技术相比,本专利技术的优点在于:1)本发本文档来自技高网
...

【技术保护点】
1.一种提升水声通信链路平均吞吐量的方法,其特征在于包括以下步骤:/n1)初始化算法参数,并输入算法的先验信息;/n2)采用随机打破限制,找到整个图G上具有最大奖励均值的arm,确定leader;/n3)遍历leader周边及自身,并计算各自的瞬时成功率;/n4)根据步骤3)所得出的瞬时成功率,计算出对应的实时吞吐量,选取具有最大吞吐量的arm,并观察收益;/n5)更新被执行arm的各参数值,包括执行次数、传输成功次数和传输失败次数;/n6)更新执行的时隙数t,即t=t+1,若t<T,则回到步骤3;若t=T,则结束,并返回该链路最佳的传输频率和传输速率组合;其中,T为总的时隙数。/n

【技术特征摘要】
1.一种提升水声通信链路平均吞吐量的方法,其特征在于包括以下步骤:
1)初始化算法参数,并输入算法的先验信息;
2)采用随机打破限制,找到整个图G上具有最大奖励均值的arm,确定leader;
3)遍历leader周边及自身,并计算各自的瞬时成功率;
4)根据步骤3)所得出的瞬时成功率,计算出对应的实时吞吐量,选取具有最大吞吐量的arm,并观察收益;
5)更新被执行arm的各参数值,包括执行次数、传输成功次数和传输失败次数;
6)更新执行的时隙数t,即t=t+1,若t<T,则回到步骤3;若t=T,则结束,并返回该链路最佳的传输频率和传输速率组合;其中,T为总的时隙数。


2.如权利要求1所述一种提升水声通信链路平均吞吐量的方法,其特征在于在步骤1)中,所述初始化算法参数,并输入算法的先验信息的具体方法为:在环境相对稳定的水声通信中,某一单链路有m个传输频率和n个传输速率可供选择,其中m>2,n>2,即一共有m×n个arm,则图G上一共有m×n个点;假设该单链路上的先验信息为所有arms的奖励均值和所有arms被选择的次数,且起始值均为零,即奖励均值起始值所有arm被选择的次数起始值假设算法的总时隙数为T。


3.如权利要求1所述一种提升水声通信链路平均吞吐量的方法,其特征在于在步骤2)中,所述确定leader的具体方法为:通过查看整个图G所有点的奖励均值找出具有最大均值所对应的arm,作为leaderL(t);由于所有arms上的均值初始值相等,所以在开始的一段时间内,在整个图G中可以存在多个leader,Agent随机地在leader集合中选取leader。
<...

【专利技术属性】
技术研发人员:岳蕾赖舒悦童景文付立群
申请(专利权)人:厦门大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1