一种基于深度强化学习的非正交接入上行传输时间优化方法技术

技术编号：19267372 阅读：28 留言：0更新日期：2018-10-27 04:33

一种基于深度强化学习的非正交接入上行传输时间优化方法，包括以下步骤：(1)在基站的覆盖范围下总共有I个移动用户，提出了一种满足移动用户的服务质量同时，在移动用户的上传量

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度强化学习的非正交接入上行传输时间优化方法
本专利技术属于通信领域，一种基于深度强化学习的非正交接入上行传输时间优化方法。
技术介绍
移动互联网业务的快速发展，对蜂窝无线接入网造成了巨大的流量压力。由于有限的无线资源，利用非正交接入技术使移动用户同时共用同一信道为无线接入提供一种有效的方法，实现在未来的5G网中超高吞吐量和大规模连接的目标。
技术实现思路
为了克服现有技术的上行传输时间较长、所有移动用户总能量消耗较大的不足，本专利技术提供一种最小化上行传输时间与所有移动用户总能量消耗的基于深度强化学习的非正交接入上行传输时间优化方法，本专利技术针对上行传输时间过大的难点，主要考虑的是利用非正交接入技术来传输数据，研究了一种基于深度强化学习的非正交接入上行传输时间优化方法。本专利技术解决其技术问题所采用的技术方案是：一种基于深度强化学习的非正交接入上行传输时间优化方法，包括以下步骤：(1)在基站的覆盖范围下总共有I个移动用户，移动用户用集合表示，移动用户使用非正交接入技术同时向基站发送数据，其中移动用户i需要发送的数据量用表示；在保证发送完成所有移动用户数据量的条件下，最小化上行传输时延和所有移动用户总能耗的优化问题描述为如下所示的优化问题ORRCM(OverallRadioResourceConsumptionMinimization)问题，ORRCM指的是整体无线资源消耗最小化：ORRCM:0≤t≤Tmax(1-3)Variables:t下面将问题中的各个变量做一个说明，如下：α:上行传输时间的权重因子；β:上行传输总能量消耗的权重因子；t:移动用...

【技术保护点】
1.一种基于深度强化学习的非正交接入上行传输时间优化方法，其特征在于，所述方法包括以下步骤：(1)在基站的覆盖范围下总共有I个移动用户，移动用户用集合

【技术特征摘要】
1.一种基于深度强化学习的非正交接入上行传输时间优化方法，其特征在于，所述方法包括以下步骤：(1)在基站的覆盖范围下总共有I个移动用户，移动用户用集合表示，移动用户使用非正交接入技术同时向基站发送数据，其中移动用户i需要发送的数据量用表示；在保证发送完成所有移动用户数据量的条件下，最小化上行传输时延和所有移动用户总能耗的优化问题描述为如下所示的优化问题ORRCM问题，ORRCM指的是整体无线资源消耗最小化：0≤t≤Tmax(1-3)Variables:t下面将问题中的各个变量做一个说明，如下：α:上行传输时间的权重因子；β:上行传输总能量消耗的权重因子；t:移动用户发送数据到基站的上行传输时间，单位是秒；是关于t的函数，表示移动用户i为了在给定上行传输时间t内完成发送数据量所需要的最小发射功率，单位是瓦特；W:移动用户到基站的信道带宽，单位是赫兹；n0:信道背景噪声的频谱功率密度；giB:移动用户i到基站的信道功率增益；移动用户i需要发送到基站的数据量，单位是兆比特；移动用户i最大上传能量消耗，单位是焦耳；Tmax:移动用户发送数据到基站的最大上行传输时间，单位是秒；(2)ORRCM问题表示如下：s.t.constraint(1-1)constraint(1-2)Variable:0≤t≤TmaxORRCM问题是在给定移动用户上传量的情况下找到最优的整体无线资源消耗(上行传输时间和所有移动用户总能量消耗)，观察ORRCM问题知道它的目标函数只有一个变量t；(3)通过强化学习算法来寻找一个最优的上行传输时间记为t*，该强化学习系统由智能体和环境所组成；所有移动用户的上行传输时间t和每个移动用户的最小发射功率都被编进了系统当前状态xT，智能体在当前状态下采取动作a进入下一个状态xT+1，同时得到环境返回的奖励r...

【专利技术属性】
技术研发人员：吴远，倪克杰，张成，冯旭，陈佳，钱丽萍，黄亮，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人