基于深度Q学习的移动边缘计算中卸载决策方法及系统技术方案

技术编号：34048547 阅读：34 留言：0更新日期：2022-07-06 15:14

基于深度Q学习的移动边缘计算中卸载决策方法及系统，它属于移动边缘计算系统中移动设备的卸载决策技术领域。本发明专利技术解决了现有移动边缘计算系统中卸载决策过程产生的时延大、能耗高的问题。本发明专利技术将深度强化学习算法应用到移动边缘计算中的卸载决策问题，根据系统中建立的本地计算队列，任务传输队列，边缘服务器队列等任务调度模型，设计对应的系统状态，动作和奖励方程。通过对比本发明专利技术方法与其他算法的平均时延和能耗，可以得出，本发明专利技术的卸载决策方法极大的降低了移动边缘计算系统中卸载决策过程产生的时延与能耗。本发明专利技术方法可以应用于移动边缘计算系统中移动设备的卸载决策。用于移动边缘计算系统中移动设备的卸载决策。用于移动边缘计算系统中移动设备的卸载决策。

Unloading decision method and system in mobile edge computing based on deep Q-learning

全部详细技术资料下载

【技术实现步骤摘要】
基于深度Q学习的移动边缘计算中卸载决策方法及系统

[0001]本专利技术属于移动边缘计算系统中移动设备的卸载决策
，具体涉及一种基于深度Q学习的移动边缘计算中卸载决策方法及系统。

技术介绍

[0002]随着5G和物联网技术的飞速发展，人们已经步入了一个万物互联的新世界。近年来，具有联网功能的移动设备，如智能手机，智能家电，智能穿戴设备等数目呈井喷式增长，与此同时，诸如虚拟现实，实时路径规划，在线视频处理等新功能的出现也对数据传输和数据计算的能力提出了更为严格的要求。如何找到一种有效的方式解决物联网设备对于数据传输和数据计算的需要是一个急需解决的难题，移动边缘计算成为了一种有效的解决方案。
[0003]虽然现有的移动边缘计算方法已经取得了一定的成就，但是现有的移动边缘计算系统中卸载决策过程产生的时延仍然较大，产生的能耗仍然较高，因此，为移动边缘计算系统提出一种卸载决策的方法以降低卸载决策过程产生的时延与能耗是十分必要的。

技术实现思路

[0004]本专利技术的目的是为解决现有移动边缘计算系统中卸载决策过程产生的时延大、能耗高的问题，而提出的一种基于深度Q学习的移动边缘计算中卸载决策方法及系统。
[0005]本专利技术为解决上述技术问题所采取的技术方案是：
[0006]基于本专利技术的一个方面，基于深度Q学习的移动边缘计算中卸载决策方法，所述方法具体包括以下步骤：
[0007]步骤一、强化学习模型构建
[0008]根据任务特性构建马尔可夫决策过程中的系统状态、...

【技术保护点】

【技术特征摘要】
1.基于深度Q学习的移动边缘计算中卸载决策方法，其特征在于，所述方法具体包括以下步骤：步骤一、强化学习模型构建根据任务特性构建马尔可夫决策过程中的系统状态、系统动作和奖励函数；步骤二、神经网络构建构建包括输入层、LSTM层、第一FC层、第二FC层和输出层的神经网络，输入层用于将系统状态信息传递给LSTM层和第一FC层，并将LSTM层的输出作为第一FC层的输入；再将第一FC层的输出作为第二FC层的输入，将第二FC层的输出作为输出层的输入。2.根据权利要求1所述的基于深度Q学习的移动边缘计算中卸载决策方法，其特征在于，所述系统状态的构建方式为：将当前时隙开始时移动设备m的自身任务大小表示为λ
m
(t)，若当前时隙开始时移动设备m存在新的任务k(t)，则λ
m
(t)＝k(t)，否则λ
m
(t)＝0；构建本地计算队列、任务传输队列和边缘节点计算队列，将当前时隙开始时移动设备m的自身任务在本地计算队列中需要等待的时隙数表示为将当前时隙开始时移动设备m的自身任务在任务传输队列中需要等待的时隙数表示为将移动设备m在边缘节点n处的队列长度表示为构建表示当前时隙之前的T个时隙内每个边缘服务器负载水平的矩阵M(t)，M(t)的维度为T
×
N，N是边缘服务器的个数；则移动设备m在当前时隙处观察到的系统状态s
m
(t)为：3.根据权利要求2所述的基于深度Q学习的移动边缘计算中卸载决策方法，其特征在于，所述系统动作表示为a(t)＝{0，1，2，
…
，N}，其中，0表示本地计算，k＝1，2，
…
，N，k表示卸载的边缘服务器的序号。4.根据权利要求3所述的基于深度Q学习的移动边缘计算中卸载决策方法，其特征在于，所述奖励函数的构建方式为：若任务被决策为本地计算，则任务等待的时隙数为：其中，表示在时隙t
′
产生的任务在本地执行完成后的时刻；任务本地计算中所需要的能量为：其中，ε
m
代表移动设备m本地计算时CPU的能耗系数，即本地CPU计算一个周期所消耗的能量，d
m
代表移动设备m当前产生的任务的计算量大小，即执行当前产生的任务需要的CPU计算周期数；设置移动用户m对...

【专利技术属性】
技术研发人员：杨柱天，朱伟强，杨蔚，佟令宇，杨佳敏，陈迪，
申请(专利权)人：中国航天科工集团八五一一研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人