当前位置: 首页 > 专利查询>贵州大学专利>正文

无线网络中多用户电力控制的决策方法技术

技术编号:38994261 阅读:12 留言:0更新日期:2023-10-07 10:25
本发明专利技术公开了一种无线网络中多用户电力控制的决策方法,包括:建模多用户电力控制问题为一个n人非合作博弈的问题,同时证明多用户电力控制博弈Nash平衡的存在性;通过在含WoLF准则的梯度上升中引入平均场项,设计含WoLF准则的平均场梯度上升WoLF

【技术实现步骤摘要】
无线网络中多用户电力控制的决策方法


[0001]本专利技术涉及多用户电力控制博弈
,特别是一种无线网络中多用户电力控制的决策方法。

技术介绍

[0002]梯度下降算法是一种逐步迭代、逐步缩减损失函数值,从而使损失函数值最小的最优化问题求解方法。在现实世界中,玩家通常不会表现出“完全理性”。这可能是由于局中人决策是近视的、决策更新过程是渐进的和计算能力是有限的,决策的这种特征被称为“有限理性”。已有研究表明,朴素的期望和近视的调整能够很好地代表人类在不预期未来的情况下选择决策的行为。鉴于这一点,基于梯度学习方法作为研究有限理性普遍模型中局中人的决策。梯度上升算法是一种常见的矩阵博弈学习相关算法,在两人两动作的一般和博弈中,Singh等证明,在无穷小步长情况下,局中人各自策略将收敛于Nash平衡或者整个过程内的平均回报将收敛于Nash平衡期望回报的极限值。随后,Bolwing等通过在无穷小梯度上升算法中引入可变学习率(或称WoLF准则),即局中人获胜时,学习速率值较小,局中人落败时,则学习速率较大,从而提出了无穷小WoLF梯度上升算法,并证明了该算法在所有双矩阵博弈中均收敛于Nash平衡。Zinkevich等提出了一种广义无穷小梯度上升算法,该算法将无穷小梯度上升算法扩展到具有两个或两个以上策略的博弈,具有普遍一致性。针对两动作的一般和随机博弈,Banerjee等提出了基于策略动态的WoLF学习算法。然而,由于梯度上升算法需要完全已知对手策略且难以拓展到多人多动作的一般和博弈中,该算法无法应用于大量的实际问题。为了解决这些问题,平均场项是一种有效的方法。当局中人数量较高时,所有其他局中人的行为被封装在一个平均场项中,每个局中人在决策时只需要知道平均场项的值,这是局中人策略对其收益函数的总体影响,而不是其他局中人的个体策略。梯度学习被用于不同类型博弈Nash平衡实现,但是目前还没有人用于分析n人非合作博弈及其应用。
[0003]无线网络系统中的关键问题之一是多用户电力控制。电力控制的主要目的是为每个信号提供足够的质量,而不会对其他信号造成不必要的干扰,也就是实现每个用户(局中人)最大化效用。近年来,无线网络中多用户电力控制问题与博弈论产生了紧密的联系。MacKenzie等表明博弈论是解决无线网络通信系统中各种问题的合适工具。Yu等研究了频率选择性干扰信道中的多用户电力控制问题,并提出了一种迭代注水(Iterative water

filling,IWF)算法以有效地达到其Nash平衡。进而,IWF算法的收敛性表明两行为矩阵博弈的Nash平衡是唯一的。Yamashita等将数字用户线路的多用户电力控制问题表述为一个非线性互补问题,采用牛顿型平滑(Newton

type smoothing,NS)方法有效地计算Nash平衡解,并得出NS算法比现有的同步IWF算法对强干扰更具鲁棒性。另外,Meshkati等使用博弈论模型来研究多载波码分多址系统中的电力控制,并提出了一种迭代分布式算法来实现电力控制博弈Nash平衡的存在性和唯一性。Hao等设计了一种基于非合作博弈的联合信道分配和电力控制优化算法,以减少无线传感器网络干扰和平衡网络能耗,并进一步证明算法
收敛于Nash平衡。同时,许多学者设计了不同的学习算法用来分析无线网络中多用户电力控制博弈。Goodman和Mandayam参考了无线数据传输网络中的电力控制,并提出了一种定价函数与发射功率成正比的算法,以实现每个用户单独最大化效用。Luo等针对数字用户线路中的多用户电力控制,提出了在更现实的信道设置和任意用户数下IWF算法的收敛性分析。He等提出一种投影神经网络来解决现代数字用户线路中多用户电力控制优化问题的Nash平衡。Tao等提出一种基于投影梯度设计的集中式电力控制算法,用于解决认知无线电网络中的多用户电力控制博弈。在文献中,基于非合作博弈的电力控制算法被提出。Gulzar等提出一种自适应电力控制算法来处理认知无线电网络的电力控制问题。Taghizadeh等提出平均场梯度上升学习算法来解决区块链网络采矿时n人非合作博弈的Nash均衡,并得到了该算法收敛的充分条件。
[0004]在过去的二十年中,无线通信已经成为一个广泛的应用和研究领域,包括蜂窝网络、卫星网络、无线网状网络、认知无线电网络、无线自组织和传感器网络等。

技术实现思路

[0005]为解决现有技术中存在的问题,本专利技术的目的是提供一种无线网络中多用户电力控制的决策方法,本专利技术将多用户电力控制博弈问题建模为一个n人非合作博弈。
[0006]为实现上述目的,本专利技术采用的技术方案是:一种无线网络中多用户电力控制的决策方法,包括以下步骤:
[0007]步骤1、建模多用户电力控制问题为一个n人非合作博弈的问题,同时证明多用户电力控制博弈Nash平衡的存在性;
[0008]步骤2、通过在含WoLF准则的梯度上升中引入平均场项,设计含WoLF准则的平均场梯度上升WoLF

MFGA算法;WoLF

MFGA算法允许局中人根据当前梯度和可变学习速率来更新策略。
[0009]作为本专利技术的进一步改进,所述步骤1具体如下:
[0010]假设所有用户都是同质的,并且每个用户的无线电力使用单价相同,每个用户的主要目的是最大化他们自己的总效用;由于每个用户所传输电力具有随机性,用户在每一轮传输电力中获胜的机会等于其发射功率与无线电力总容量的比例:
[0011][0012]其中N={1,

,n}是所有用户的集合,n表示所有用户的数量,P
isuc.
是第i个用户成功分配电力的概率分布和x
i
是用户i在载波上的传输电力;设x
i
∈X
i
,其中且
[0013]定义一个适用于数据应用的效用函数;定义用户\效用函数为其吞吐量和传输电力的比值:
[0014][0015]其中q
i
是第i个用户的传输电力,T
i
表示第i个用户的吞吐量,指单位时间内无差错
传输的净信息比特数,即有效传输;吞吐量表示为:
[0016][0017]其中L是信号比特的数量,M是数据包的总比特数;R
i
和l
i
分别是第i个用户的传输速率和信号干扰噪声比;f(l
i
)是成功传输电力的效用函数,也就是无错误接收传输电力的概率;
[0018]假设一个传输终端有一个或多个比特错误,它将被重传;f(l
i
)为递增,连续的,伴随着f(∞)=1的S

型函数,且要求f(0)=0去确保p
i
=0时A
i
=0;
[0019]考虑传输电力的成本,用户i的支付函数可以表示为:
[0020][0021]其中p
i
是第i个用户传输电力的单价,E
i...

【技术保护点】

【技术特征摘要】
1.一种无线网络中多用户电力控制的决策方法,其特征在于,包括以下步骤:步骤1、建模多用户电力控制问题为一个n人非合作博弈的问题,同时证明多用户电力控制博弈Nash平衡的存在性;步骤2、通过在含WoLF准则的梯度上升中引入平均场项,设计含WoLF准则的平均场梯度上升WoLF

MFGA算法;WoLF

MFGA算法允许局中人根据当前梯度和可变学习速率来更新策略。2.根据权利要求1所述的无线网络中多用户电力控制的决策方法,其特征在于,所述步骤1具体如下:假设所有用户都是同质的,并且每个用户的无线电力使用单价相同,每个用户的主要目的是最大化他们自己的总效用;由于每个用户所传输电力具有随机性,用户在每一轮传输电力中获胜的机会等于其发射功率与无线电力总容量的比例:其中N={1,...,n}是所有用户的集合,n表示所有用户的数量,P
isuc.
是第i个用户成功分配电力的概率分布和x
i
是用户i在载波上的传输电力;设x
i
∈X
i
,其中且定义一个适用于数据应用的效用函数;定义用户\效用函数为其吞吐量和传输电力的比值:其中q
i
是第i个用户的传输电力,T
i
表示第i个用户的吞吐量,指单位时间内无差错传输的净信息比特数,即有效传输;吞吐量表示为:其中L是信号比特的数量,M是数据包的总比特数;R
i
和l
i
分别是第i个用户的传输速率和信号干扰噪声比;f(l
i
)是成功传输电力的效用函数,也就是无错误接收传输电力的概率;假设一个传输终端有一个或...

【专利技术属性】
技术研发人员:贾文生刘露萍
申请(专利权)人:贵州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1