The application discloses an edge computing task allocation method based on deep Monte Carlo tree search to support the optimization of resource allocation by edge servers. The edge server takes the status of mobile edge computing system as input, and the resource scheduling module of edge server outputs the optimal resource allocation scheme through deep reinforcement learning algorithm. The mobile device terminal unloads the task according to the optimal resource allocation scheme and executes the task together with the edge server. Compared with greedy search algorithm and dqn algorithm, the algorithm proposed in this paper can greatly improve the optimization of service delay and service energy consumption of mobile terminals.
【技术实现步骤摘要】
一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法
本专利技术涉及一种智能通信领域,特别涉及一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法。
技术介绍
目前已有一些算法被应用于移动边缘计算资源的优化分配中。第一种方法采用线性规划算法,对计算资源和带宽资源进行优化,来提高系统最大吞吐量并降低服务响应延时,以提升移动边缘系统性能,但该方法不能调整任务的卸载率。第二种是基于Lyapunov的优化方法,是一种动态调整计算任务卸载率的算法,能够降低计算任务完成的时间,其缺点在于能处理的任务复杂度较低,不能处理复杂度较高的分配任务。并且这两种资源分配优化方法中采用的线性规划算法、Lyapunov算法都是启发式学习,需要人类的经验进行指导才能完成。此外,5G物联网场景下移动设备数量大幅增加,移动用户终端计算任务的需求多样,优化问题变得复杂,现有的方法很难处理高复杂度的优化问题。
技术实现思路
本专利技术的目的在于克服现有技术中所存在的上述不足,提供一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法,在移动用户终端计算任务的需求多样、优化问题变得复杂时,也能实现对环境资源分配的优化。为了实现上述专利技术目的,本专利技术提供了以下技术方案:当移动用户终端生成计算任务时,边缘服务器更新移动边缘计算系统状态信息;所述移动边缘计算系统包括移动设备终端,无线通信基站,边缘服务器;所述移动边缘计算系统状态信息包括边缘服务器的计算能力,无线通信基站的无线带宽资源,移动设备的任务请求信息,所述任务请求信息包括每个移动设备终端和基站的历史信道增益信息,当前待处理的任务的数据量大小,完成当前任务所 ...
【技术保护点】
1.一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法,其特征在于,所述方法包括:步骤一:边缘服务器更新移动边缘计算系统状态信息;所述移动边缘计算系统状态信息包括:边缘服务器的计算资源情况、无线通信基站与移动终端的通信资源情况,以及移动设备的任务请求信息;所述任务请求信息包括:每个移动设备终端和无线通信基站的信道增益信息、当前待处理的任务的数据量大小、移动设备终端完成当前任务所需的CPU时钟周期数,以及移动设备终端CPU时钟频率;步骤二:边缘服务器将移动边缘计算系统状态信息传输到DNN、MCTS和LSTM;所述LSTM根据移动设备终端和无线通信基站的信道增益预测未来信道增益,并将得到的信道增益预测数据发送到MCTS和DNN;所述DNN根据移动边缘计算系统状态信息和信道增益预测数据得到资源分配动作先验概率,将得到的资源分配动作先验概率发送给MCTS;步骤三:MCTS根据所述移动边缘计算系统状态信息、信道增益预测数据和资源分配动作先验概率进行搜索,得到最优资源分配方案;并将所述最优资源分配方案发送给移动设备终端,移动设备终端将任务卸载给移动边缘计算系统执行模块,移动边缘计算系统执行模块根据最 ...
【技术特征摘要】
1.一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法,其特征在于,所述方法包括:步骤一:边缘服务器更新移动边缘计算系统状态信息;所述移动边缘计算系统状态信息包括:边缘服务器的计算资源情况、无线通信基站与移动终端的通信资源情况,以及移动设备的任务请求信息;所述任务请求信息包括:每个移动设备终端和无线通信基站的信道增益信息、当前待处理的任务的数据量大小、移动设备终端完成当前任务所需的CPU时钟周期数,以及移动设备终端CPU时钟频率;步骤二:边缘服务器将移动边缘计算系统状态信息传输到DNN、MCTS和LSTM;所述LSTM根据移动设备终端和无线通信基站的信道增益预测未来信道增益,并将得到的信道增益预测数据发送到MCTS和DNN;所述DNN根据移动边缘计算系统状态信息和信道增益预测数据得到资源分配动作先验概率,将得到的资源分配动作先验概率发送给MCTS;步骤三:MCTS根据所述移动边缘计算系统状态信息、信道增益预测数据和资源分配动作先验概率进行搜索,得到最优资源分配方案;并将所述最优资源分配方案发送给移动设备终端,移动设备终端将任务卸载给移动边缘计算系统执行模块,移动边缘计算系统执行模块根据最优资源分配方案执行最优资源分配行为。2.根据权利要求1所述的一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法,其特征在于,预先对所述DNN进行训练,使其满足:当有移动边缘计算系统状态信息和信道增益预测数据输入时,能够输出资源分配动作先验概率给MCTS。3.根据权利要求1所述的一种基于深度蒙特卡洛树搜索的边缘计算任务分配方法,其特征在于,步骤三中所述搜索包括以下步骤:s1:MCTS根据移动边缘计算系统状态初始化根节点;s2:将根节点设置为搜索起点进行下一次搜索;s3:判断是否完成预定次数的搜索,若是,执行步骤s9,若否,则执行步骤s4;s4:判断当前节点是否为叶子节点,若是,执行步骤s5,若否,则执行步骤s6;s5:进入到叶子节点后,即计算资源分配完成后,评估该资源分配方案,返回奖赏,根据奖赏更新该条路径上所有节点的状态;s6:判断当前节点是否为已全扩展节点,若否,执行步骤s7,若是,则执行步骤s8;s7:根据DNN的输出的资源分配动作先验概率扩展当前节点的所有子节点,并根据公式选择下一节点,其中Q(v′k)定义为节点v′k的累积奖励值,N(v′k)定义为节点v′k的访问次数,e为平衡算法开发探索的比例系数,p(v′k|sk)表示下一节点的先验概率,k表示当前节点的层数;s8:从所有可能的资源分配动作中选取搜索价...
【专利技术属性】
技术研发人员:陈杰男,陈思宇,李帅,王琪,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。