一种离散变量优化问题的深度学习方法技术

技术编号：38986797 阅读：9 留言：0更新日期：2023-10-07 10:17

本发明专利技术公开了一种离散变量优化问题的深度学习方法，属于深度学习领域；具体为：首先，针对eMBB和URLLC混合业务的单用户上行传输场景，通过优化功率和资源块分配，最小化所有业务占用的资源块总数，进行问题建模；然后，引入系列函数，将原问题转化为适合深度神经网络学习的问题，设计自适应参数方法，优化平滑函数的参数；接着，设计策略网络和乘子网络，在训练过程中交替更新平滑参数和网络参数；最后，输入新的环境参数到训练好的策略网络中，利用分段最大值函数等得到功率策略，利用示性函数得到RB策略。本发明专利技术更好地权衡函数估计误差和梯度绝对值大小之间的关系，避免因异常梯度问题或函数误差较大而导致占用更多的资源块。或函数误差较大而导致占用更多的资源块。或函数误差较大而导致占用更多的资源块。

全部详细技术资料下载

【技术实现步骤摘要】
一种离散变量优化问题的深度学习方法

[0001]本专利技术属于深度学习领域，具体涉及一种离散变量优化问题的深度学习方法。

技术介绍

[0002]离散变量优化是指在满足约束条件下，找到使目标函数最大化或最小化的决策变量的取值，其中部分或全部决策变量被限制为一组离散的值。在通信系统中，离散变量优化的研究与用户调度和资源分配等问题密切相关[1][2]。
[0003]许多离散变量优化问题是NP难的，利用传统的数值方法往往具有较高的复杂度。相比之下，基于深度学习的方法可以从数据中学习环境参数和资源分配策略之间的关系，从而显著降低在线推断的复杂度[3]。因此，一类基于深度学习解决离散变量优化问题的方法被广泛研究。
[0004]然而，由于神经网络通常利用梯度下降方法(Gradient Descent,GD)更新参数，因此离散变量的异常梯度问题往往会导致神经网络的学习效果不佳。
[0005]在现有文献中，一类广泛利用的方法是在反向传播过程中采用平滑函数近似离散函数来计算梯度，避免梯度消失。例如，利用Sigmoid函数近似示性函数[4]，或利用SoftMax函数近似One
‑
hot函数[5]。在平滑函数中引入参数可以用来权衡离散误差和梯度大小之间的关系。现有方法通常在训练过程中固定参数，或利用退火的方法设置参数随着训练迭代次数而变化。例如，Gumbel
‑
SoftMax方法中的温度系数随着迭代次数减小，控制平滑函数和原函数的误差逐渐减小[5]。参数的设置需要非常仔细地利用大量...

【技术保护点】

【技术特征摘要】
1.一种离散变量优化问题的深度学习方法，其特征在于，具体步骤如下：步骤一、针对eMBB和URLLC混合业务的单用户上行传输场景，通过优化功率和资源块RB分配，最小化所有业务占用的资源块RB总数，同时满足eMBB和URLLC业务的服务质量要求，进行问题建模；问题建模为：问题建模为：问题建模为：问题建模为：问题建模为：问题建模为：p
f
≥0，f＝1，...，F其中，F为资源块RB的总数，表示是否分配给用户的eMBB或URLLC业务，L为每个RB中的子载波数，B为子载波间隔，时长为为每个RB中的子载波数，B为子载波间隔，时长为表示在基站进行最大比合并的情况下用户在RB
f
的功率归一化信噪比，α为大尺度信道增益，σ2是噪声功率，是用户在RB
f
的信道向量，假设h
f
在RB
f
的子载波和的持续时间内是相同的，p
f
是分配给RB
f
的功率，是信道色散，Q
‑1(
·
)是Q函数的逆函数，∈是URLLC业务的传输错误率要求，R
E
和R
U
分别为eMBB和URLLC业务的传输速率要求，P
max
表示最大传输功率；约束1和约束2分别为eMBB和URLLC业务的QoS约束；约束3为RB
f
最多被一个用户的一个业务占用；约束4为每个RB只能被完整占用；约束5为功率总和约束；约束6为功率非负约束；步骤二、通过引入系列函数，将原始问题建模转化为适合深度神经网络学习的问题P0：P0：P0：P0：其中，表示eMBB或URLLC分配给RB
f
的功率；引入系列函数包括：ReLU函数，归一化函数，示性函数，分段最大值函数和平滑函数；
步骤三、设计自适应参数方法，对问题P0中平滑函数的参数进行优化；参数包括：对于不同的和迭代次数n，设计不同的参数k
W，E
，k
W，U
，定义为对于不同的和迭代次数n，设计不同的参数k
I
，定义为对于不同的和迭代次数n，设计不同的参数k
U
，定义为1)、关于平滑函数的自适应参数方法设计为：在网络训练的第n次迭代中，利用最大、最小梯度要球和计算第n次迭代的梯度要求其中N
iter
为网络训练总次数；然后，利用和计算参数问题建模为：其中，β为较大的正数，利用二分搜索求解得到2)、关于平滑函数的自适应参数方法设计为：在网络训练的第n次迭代中，利用最大、最小梯度要求和计算第n次迭代的梯度要求然后，利用和计算参数问题建模为：其中，利用二分搜索求解得到3)、关于平滑函数的自适应参数方法设计为：在网络训练的第n次迭代中，利用最大、最小梯度要求和计算第n次迭代的梯度要球然后，利用和计算参数问题分别建模为：问题分别建模为：其中，利用二分搜索求解得到步骤四、结合自适应参数方法和非监督学习，将问题P0转化为对偶无约束优化问题P3，并设计策略网络和乘子网络；
步骤4.1：利用自适应参数和将问题P0转化问题P1：P1：P1：P1：其中，步骤4.2：将参数优化问题P1转化为泛函优化问题P2：定义功率向量和信道向量为了学习p和γ之间的函数关系，即p(γ)，将参数优化问题P1转化为泛函优化问题P2：P2：P2：P2：步骤4.3：在问题P2中的约束条件中引入拉格朗日乘子ξ和λ，将问题P2转化为对偶的无约束优化问题P3；由于约束条件应对γ的所有可能值成立，Lagrange乘子ξ和λ是γ的函数，即ξ(γ)和λ(γ)；P...

【专利技术属性】
技术研发人员：韩圣千，殷曼茹，杨晨阳，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人