一种基于深度强化学习的物联网频谱分配优化方法及系统技术方案

技术编号：35878992 阅读：18 留言：0更新日期：2022-12-07 11:17

本发明专利技术属于工业物联网频谱管理技术领域，具体涉及一种基于深度强化学习的物联网频谱分配优化方法及系统。考虑到全局信道信息未知的情况下，提出一种基于多智能体深度强化学习的工业物联网频谱分配优化方法。首先，构造多个设备对设备通信链路的系统模型。其次，构建优化问题，结合频谱子带和传输功率等约束条件以优化物联网网络综合效率。接着，将优化问题描述为马尔可夫决策过程。最后，针对上述优化问题具有较大的状态空间和动作空间，提出了多智能体深度Q网络算法。借助于经验回放机制和目标网络策略，以实现最优的频谱子带选择和传输功率分配策略。输功率分配策略。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度强化学习的物联网频谱分配优化方法及系统

[0001]本专利技术属于工业物联网频谱资源管理
，具体涉及一种基于深度强化学习的物联网频谱分配优化方法及系统。

技术介绍

[0002]随着信息时代的快速发展，工业物联网得到了蓬勃的发展。然而，随着工业物联网中无线设备的增加，加剧了对有限频谱资源和设备通信需求之间的矛盾。为了缓解这一现象，许多研究人员都提出了优化方法来应对。但是，在实际情况中，需要获取全局信道状态信息是非常困难的且计算复杂度高，现有的优化方法难以得到最优策略。因此，提出了一种多智能体深度强化学习方法来获得与蜂窝通信链路共享频谱的最优策略，并使工业物联网网络综合效率最大化。

技术实现思路

[0003]为了克服现有技术的存在的不足，本专利技术的目的旨在提出一种基于深度强化学习的频谱分配优化方法。
[0004]为了达到上述目的，本专利技术采用的技术方案是：一种基于深度强化学习的物联网频谱分配优化方法，其特征在于，包括：构造多个设备对设备通信链路的系统模型；基于构造的系统模型采集系统相关参数，包括蜂窝通信链路的信噪比和在频谱子带上的传输速率，也包括设备对设备通信链路的信噪比、所选择的频谱子带及其传输功率；构建优化目标函数以及约束条件；将采集的相关参数输入至优化目标函数以及约束条件，基于马尔可夫决策采用多智能体深度Q网络算法对目标函数进行求解，输出最优的频谱子带选择和传输功率分配策略，包括蜂窝通信链路效率、多个设备对设备通信链路效率以及最后所考虑的工业物联网网络效率。
[...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的物联网频谱分配优化方法，其特征在于，包括：构造多个设备对设备通信链路的系统模型；基于构造的系统模型采集系统相关参数，包括蜂窝通信链路的信噪比和在频谱子带上的传输速率，也包括设备对设备通信链路的信噪比、所选择的频谱子带及其传输功率；构建优化目标函数以及约束条件；将采集的相关参数输入至优化目标函数以及约束条件，基于马尔可夫决策采用多智能体深度Q网络算法对目标函数进行求解，输出最优的频谱子带选择和传输功率分配策略，包括蜂窝通信链路效率、多个设备对设备通信链路效率以及最后所考虑的工业物联网网络效率。2.根据权利要求1所述的一种基于深度强化学习的物联网频谱分配优化方法，其特征在于，多个设备对设备通信链路的系统模型包括：一个基站；个蜂窝通信链路；个设备对设备通信链路；其中，蜂窝通信链路用于获取高数据速率的服务，多个设备对设备通信链路用于设备之间的双向通信；假设蜂窝通信链路的频谱被分成个正交频谱子带，且每个频谱子带带宽为。3.根据权利要求2所述的一种基于深度强化学习的物联网频谱分配优化方法，其特征在于：多个设备对设备通信链路可能有不同的频谱子带选择，二元频谱分配向量被定义为，并且，当设备对设备通信链路复用蜂窝通信链路的频谱子带时，；当时，设备对设备通信链路未复用蜂窝通信链路的频谱子带；定义每个设备对设备通信链路最多只能复用一个频谱子带，即：。4.根据权利要求3所述的一种基于深度强化学习的物联网频谱分配优化方法，其特征在于：蜂窝通信链路在频谱子带上的信噪比：蜂窝通信链路在频谱子带上数据的传输速率可以表示为：设备对设备通信链路在频谱子带上的信噪比：
干扰功率可以表示为：设备对设备通信链路在频谱子带上的传输速率为：其中，蜂窝通信链路在频谱子带上到基站的信道增益被表示为；将表示为频谱子带上蜂窝通信链路的传输功率；是噪声功率，为二元频谱分配向量，表示频谱子带上设备对设备通信链路的传输功率，是设备对设备通信链路在频谱子带上到基站的干扰信道增益；为频谱子带带宽，是蜂窝通信链路在频谱子带上信噪比；是频谱子带上的设备对设备通信链路在频谱子带的信道功率增益，是设备对设备通信链路在频谱子带上的接收到的干扰功率；为二元频谱分配向量，是蜂窝通信链路到设备对设备通信链路的干扰信道增益，是设备对设备通信链路到设备对设备通信链路的干扰信道增益。5.根据权利要求4所述的一种基于深度强化学习的物联网频谱分配优化方法，其特征在于：将蜂窝通信链路效率和设备对设备通信链路效率加权和定义为工业物联网网络效率：其中，和是平衡蜂窝通信链路和设备对设备通信链路效率的权重；蜂窝通信链路效率表示为：设备对设备通信链路的效率表示为：
其中，其中，和分别为蜂窝通...

【专利技术属性】
技术研发人员：王家烨，金波，张凤莲，武明虎，赵楠，王茹，杜万银，孙萌，杨成健，郭乐铭，
申请(专利权)人：湖北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人