一种基于深度确定性策略梯度的集能型无线中继网络吞吐量最大化方法技术

技术编号:19938694 阅读:46 留言:0更新日期:2018-12-29 06:49
一种基于深度确定性策略梯度的集能型无线中继网络吞吐量最大化方法,包括以下步骤:1)集能型无线中继网络中通过可再生能量优化管理实现最大吞吐量,其中,优化问题描述为一个多变量优化问题;2)将问题P1分解为两部分优化:功率子优化和时隙子优化,即深度确定性策略梯度方法优化变量pi和

【技术实现步骤摘要】
一种基于深度确定性策略梯度的集能型无线中继网络吞吐量最大化方法
本专利技术涉及集能型无线中继网络
,尤其是一种基于深度确定性策略梯度的集能型无线中继网络吞吐量最大化方法。
技术介绍
由于无线设备和新兴多媒体业务的激增,移动数据流量一直呈指数级增长。由于诸如路径损耗,阴影和小规模衰落的信道损耗,越来越多的室内和边缘用户可能会遇到低质量的服务性能。为了克服这种障碍,中继辅助接入技术已经被提出作为开发能量效率和空间分集以提高室内和小区边缘用户服务质量的有价值的解决方案。中继基站将作为边缘用户与宏蜂窝基站之间进行通信的中转站。然而,密集地部置中继基站所产生的能耗以及随之带来的温室气体(如二氧化碳)排放量也是巨大的。出于对环境及经济效益的双重考量,能量采集技术被引入到无线中继网络中,中继基站及无线设备通过采集可再生能源(如太阳能,风能,热电,机电和环境射频能量等)进行供电已成为提高绿色中继网络能源效率和减少温室气体排放总量的可行技术。然而,由于可再生能量到达的不连续性,为了提供可靠的数据传输及网络吞吐量保障,对可再生能量优化管理变得尤为重要。
技术实现思路
为了避免由于信道和可再生能量不确定本文档来自技高网...

【技术保护点】
1.一种基于深度确定性策略梯度的集能型无线中继网络吞吐量最大化方法,其特征在于:所述方法包括以下步骤:1)集能型无线中继网络中通过可再生能量优化管理实现最大吞吐量,其中,优化问题描述为一个多变量优化问题:P1:

【技术特征摘要】
1.一种基于深度确定性策略梯度的集能型无线中继网络吞吐量最大化方法,其特征在于:所述方法包括以下步骤:1)集能型无线中继网络中通过可再生能量优化管理实现最大吞吐量,其中,优化问题描述为一个多变量优化问题:P1:受限于:(约束条件1)(约束条件2)(约束条件3)(约束条件4)(约束条件5)在此,问题P1的各参数定义如下:pi:中继节点在时隙i的传输功率;ri:中继节点在时隙i的数据率;τi:源节点在时隙i的传输时间;中继节点在时隙i的传输时间;ui:源节点在时隙i的数据率;hi:中继节点到目的节点的信道增益;Ei:中继节点在时隙i时所采集的能量;Emax:中继节点的电池最大容量;Qmax:中继节点的数据缓存容量;L:单个时隙长度;T:传输时隙数;W:网络带宽;2)将问题P1分解为两部分优化:功率子优化和时隙子优化,即通过优化变量pi和来得到最优的ri,其中,通过深度确定性策略梯度方法来优化中继节点在各时隙i上的传输功率pi和传输时间从而最终决定问题P1中各时隙i的数据率ri之和的最大化;该深度确定性策略梯度方法由执行单元,评分单元和环境所组成,所有的传输功率pi和传输时间都被编进了执行单元所需的状态xt,执行单元在当前状态下采取动作a对传输功率pi和传输时间进行更改并进入下一个状态xt+1,同时得到环境返回的奖励r(xt,a),评分单元结合状态xt,动作a以及环境返回的奖励r(xt,a)给执行单元打分,即表明执行单元在状态xt下采取动作a是好是坏;执行单元的目标就是让评分单元所打的分越高越好,而评分单元的目标是让自己每次打出的分都接近真实,这可以通过奖励r(xt,a)来调节;在执行单元,评分单元和环境不断交互更新下,传输功率pi和传输时间将不断被优化直到被更新到最优,评分单元的更新方式为:S(xt,a)=r(xt,a)+γS′(xt+1,a′)(3)其中,各参数定...

【专利技术属性】
技术研发人员:钱丽萍冯安琪冯旭黄玉蘋黄亮吴远
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1