一种基于深度确定性策略梯度方法的移动边缘计算分流决策方法技术

技术编号：19126766 阅读：47 留言：0更新日期：2018-10-10 08:08

一种基于深度确定性策略梯度方法的移动边缘计算分流决策方法，包括以下步骤：1)计算出在给出分流决策下系统中所有的能量损耗；2)通过深度确定性策略方法来寻找一个最优的分流决策xnm，所有用户的分流决策xnm都被编进执行单元所需的状态xt；3)所有无线设备的分流决策xnm作为深度确定性策略方法的状态xt，动作a则是对状态xt的更改，更改后系统的总能量损耗会与一个设定的标准值进行比较，如果比这个标准值大则使当前奖励r(xt，a)设为正值，反之设为负值，同时系统进入下一状态xt+1，不断重复这个迭代过程直到得到最佳分流决策xnm。本发明专利技术在保证用户体验的前提下最小化能量损耗。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度确定性策略梯度方法的移动边缘计算分流决策方法
本专利技术属于通信领域，尤其是涉及移动边缘计算的通信系统以及基于深度确定性策略梯度方法的移动边缘计算分流决策方法。
技术介绍
随着无线通信技术的广泛发展，无线通信技术已经渗入到人类生活的方方面面。移动边缘计算拓展了移动设备的能力，在丰富的云资源的帮助下，用户体验得到极大提升。在一个多用户的移动通信系统中，所有用户共同占用传输资源。用户将自身的任务分流至基站或者云端时，可以减少自己的能量损耗，但这些被分流的任务的服务质量会受一些额外损耗的影响，比如传输延时。为了最小化所有的能量损耗，保证服务质量，最优的任务分流决策方法应用是很有必要的。
技术实现思路
为了克服现有移动通信网络的能量损耗较大的不足，为了最小化系统中所有的能量损耗，保证服务质量，本专利技术提供了一种适用于移动边缘计算的基于深度确定性策略梯度方法的分流决策方法，在保证用户体验的前提下最小化能量损耗。本专利技术解决其技术问题所采取的技术方案是：一种基于深度确定性策略梯度方法的移动边缘计算分流决策方法，所述方法，包括以下步骤：1)在一个由多个用户组成，并且每个用户都有多个独立的任务的移动通信系统中，xnm为用户n的任务m的分流决策，如果xnm为1则表示用户n的任务m将被分流至基站或云端处理，xnm为0则表示在本地处理；当用户n的任务m被分流时，其上行传输速率和下行传输速率受传输总带宽CU和CD的限制；当用户n的任务m在本地处理时，本地移动设备所产生的能量损耗为如果在云端处理时，所产生的能量损耗为系统总损耗最小化表示为：约束条件为：式中：其中，各参数...
一种基于深度确定性策略梯度方法的移动边缘计算分流决策方法

【技术保护点】
1.一种基于深度确定性策略梯度方法移动边缘计算分流决策方法，其特征在于，所述方法包括以下步骤：1)在一个由多个用户组成，并且每个用户都有多个独立的任务的移动通信系统中，xnm为用户n的任务m的分流决策，如果xnm为1则表示用户n的任务m将被分流至基站或云端处理，xnm为0则表示在本地处理；当用户n的任务m被分流时，其上行传输速率

【技术特征摘要】
1.一种基于深度确定性策略梯度方法移动边缘计算分流决策方法，其特征在于，所述方法包括以下步骤：1)在一个由多个用户组成，并且每个用户都有多个独立的任务的移动通信系统中，xnm为用户n的任务m的分流决策，如果xnm为1则表示用户n的任务m将被分流至基站或云端处理，xnm为0则表示在本地处理；当用户n的任务m被分流时，其上行传输速率和下行传输速率受传输总带宽CU和CD的限制；当用户n的任务m在本地处理时，本地移动设备所产生的能量损耗为如果在云端处理时，所产生的能量损耗为系统总损耗最小化表示为：约束条件为：式中：其中，各参数定义如下：N：用户人数；M：每个用户的任务数；xnm：用户n的任务m的分流决策，为1时表示在云端处理，为0时在本地处理；用户n的任务m在本地处理时的能量损耗；用户n的任务m被分流时，传输过程中能量损耗；用户n的任务m在云端处理时的能量损耗；ρ：在云端处理时，能量损耗的转化权重；ωn：用户n延时损耗的转化权重；用户n的任务m在本地处理时的延时损耗；用户n的任务在云端处理时的总延时损耗；2)为了保证服务质量，当任务在云端处理时，数据从本地上传到云端所消耗的时间以及处理时间都将被考虑在内，每个用户n的任务由发送数据DOnm和接收数据DInm组成，当任务分流至云端时，期间所消耗的时间与本地和基站间的传输速率RAC相关；在云端处理时，时间消耗由发送数据大小和云端处理速度fC决定；由于数据传输和处理时间会有重叠，而重叠部分难以估算，所以总的时间损耗考虑为所有时间消耗的总和式中：其中，各参数定义如下：DInm：用户n的任务m的接收数据大小；DOnm：用户n的任务m的发送数据大小；用户n的上传速度；用户n的下行速度；RAC：基站与云端的传输速率；ATnm：每处理单位的数据需要的处理循环次数；fC：云端处理器的处理速度；3)通过深度确定性策略梯度方法来寻找一个最优的分流决策，即所有用户的分流决策xnm，该深度确定性策略梯度方法由执行单元，评分单元和环境所组成，所有用户的分流决策xnm都被编进了执行单元所需的状态xt，执行单元在当前状态下采取动作a对分流决策xnm进行更改并进入下一个状态xt+1，同时得到环境返回的奖励r(xt,a)，评分单元结合状态xt，动作a以及环境返回的奖励r(xt,a)给执...

【专利技术属性】
技术研发人员：黄亮，冯旭，钱丽萍，吴远，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人