无线网络中多用户电力控制的决策方法技术

技术编号：38994261 阅读：12 留言：0更新日期：2023-10-07 10:25

本发明专利技术公开了一种无线网络中多用户电力控制的决策方法，包括：建模多用户电力控制问题为一个n人非合作博弈的问题，同时证明多用户电力控制博弈Nash平衡的存在性；通过在含WoLF准则的梯度上升中引入平均场项，设计含WoLF准则的平均场梯度上升WoLF

全部详细技术资料下载

【技术实现步骤摘要】
无线网络中多用户电力控制的决策方法

[0001]本专利技术涉及多用户电力控制博弈
，特别是一种无线网络中多用户电力控制的决策方法。

技术介绍

[0002]梯度下降算法是一种逐步迭代、逐步缩减损失函数值，从而使损失函数值最小的最优化问题求解方法。在现实世界中，玩家通常不会表现出“完全理性”。这可能是由于局中人决策是近视的、决策更新过程是渐进的和计算能力是有限的，决策的这种特征被称为“有限理性”。已有研究表明，朴素的期望和近视的调整能够很好地代表人类在不预期未来的情况下选择决策的行为。鉴于这一点，基于梯度学习方法作为研究有限理性普遍模型中局中人的决策。梯度上升算法是一种常见的矩阵博弈学习相关算法，在两人两动作的一般和博弈中，Singh等证明，在无穷小步长情况下，局中人各自策略将收敛于Nash平衡或者整个过程内的平均回报将收敛于Nash平衡期望回报的极限值。随后，Bolwing等通过在无穷小梯度上升算法中引入可变学习率(或称WoLF准则)，即局中人获胜时，学习速率值较小，局中人落败时，则学习速率较大，从而提出了无穷小WoLF梯度上升算法，并证明了该算法在所有双矩阵博弈中均收敛于Nash平衡。Zinkevich等提出了一种广义无穷小梯度上升算法，该算法将无穷小梯度上升算法扩展到具有两个或两个以上策略的博弈，具有普遍一致性。针对两动作的一般和随机博弈，Banerjee等提出了基于策略动态的WoLF学习算法。然而，由于梯度上升算法需要完全已知对手策略且难以拓展到多人多动作的一般和博弈中，该算法无法应用于大量的实际问题。为了

【技术保护点】

【技术特征摘要】
1.一种无线网络中多用户电力控制的决策方法，其特征在于，包括以下步骤：步骤1、建模多用户电力控制问题为一个n人非合作博弈的问题，同时证明多用户电力控制博弈Nash平衡的存在性；步骤2、通过在含WoLF准则的梯度上升中引入平均场项，设计含WoLF准则的平均场梯度上升WoLF
‑
MFGA算法；WoLF
‑
MFGA算法允许局中人根据当前梯度和可变学习速率来更新策略。2.根据权利要求1所述的无线网络中多用户电力控制的决策方法，其特征在于，所述步骤1具体如下：假设所有用户都是同质的，并且每个用户的无线电力使用单价相同，每个用户的主要目的是最大化他们自己的总效用；由于每个用户所传输电力具有随机性，用户在每一轮传输电力中获胜的机会等于其发射功率与无线电力总容量的比例：其中N＝{1,...,n}是所有用户的集合，n表示所有用户的数量，P
isuc.
是第i个用户成功分配电力的概率分布和x
i
是用户i在载波上的传输电力；设x
i
∈X
i
，其中且定义一个适用于数据应用的效用函数；定义用户\效用函数为其吞吐量和传输电力的比值：其中q
i
是第i个用户的传输电力，T
i
表示第i个用户的吞吐量，指单位时间内无差错传输的净信息比特数，即有效传输；吞吐量表示为：其中L是信号比特的数量，M是数据包的总比特数；R
i
和l
i
分别是第i个用户的传输速率和信号干扰噪声比；f(l
i
)是成功传输电力的效用函数，也就是无错误接收传输电力的概率；假设一个传输终端有一个或...

【专利技术属性】
技术研发人员：贾文生，刘露萍，
申请(专利权)人：贵州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人