一种基于深度强化学习的MEC已卸载任务资源分配方法组成比例

技术编号：33434410 阅读：11 留言：0更新日期：2022-05-19 00:23

本发明专利技术属于边缘计算技术领域，具体是涉及一种基于深度强化学习的MEC已卸载任务计算资源分配方法。通过构建深度神经网络，将资源分配状态窗口与已卸载任务集合队列作为网络的输入，通过神经网络的前向传播输出每个动作a对应的Q值，根据资源分配策略π选择动作a从而与环境产生交互使当前状态s转换为下一状态s

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度强化学习的MEC已卸载任务资源分配方法

[0001]本专利技术属于边缘计算
，具体是涉及一种基于深度强化学习的MEC已卸载任务计算资源分配方法。

技术介绍

[0002]作为一种新兴技术，移动边缘计算(MEC)通过将云计算服务从集中式云扩展至网络边缘，具有在靠近终端设备的无线接入网(RAN)中提供云计算服务的能力。与移动云计算(MCC)相比，MEC使得各式各样的应用以及服务能在移动边缘网络中运行，不仅大大降低了整个业务延迟，而且极大程度上地缓解了由于数据交换所造成的移动核心网络的拥塞。因此，在MEC系统部署应用程序和服务，通过将任务请求数据计算卸载到MEC边缘服务器执行，能够显著地提升用户体验。
[0003]通过利用移动边缘计算(MEC)，物联网设备产生的大量数据可以在网络边缘进行处理和分析。然而，MEC系统通常只有有限的虚拟资源，这些资源由物联网边缘应用程序共享和竞争。不同的物联网边缘应用可能需要不同数量的资源来保证服务质量，一个重要的挑战是如何协调每个应用程序的有限资源以实现高资源利用率，因此，寻找一种最优的分配方案来高效合理地利用有限的资源成为相关领域研究人员所需克服的难点之一。

技术实现思路

[0004]本专利技术的目的是，针对单边缘服务器计算资源的不足，提出一种基于深度强化学习的卸载任务资源分配方案。其特点是构建深度神经网络，将资源分配状态窗口与已卸载任务集合队列作为网络的输入，通过神经网络的前向传播输出每个动作a对应的Q值，根据资源分配策略π选择动作a从而与环境产生...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的MEC已卸载任务资源分配方法，获取单位时间窗口的卸载任务集合队列L，基于边缘节点的计算资源分配状态窗口C；定义边缘服务器拥有的计算资源数为n
c
，通过将单位时间窗口分割为n
τ
个时间片，令L从当前的时间片开始分配计算资源，并展望未来n
τ
个时间片，一个时间片的持续时间称为一个时间单位，定义C中的每个计算单元表示一个时间片中的一个计算资源，是资源分配的最小单位；对于某一计算单元表示i
τ
个时间片的第i
c
个计算资源的分配状态，其中i
τ
∈{1,2,
…
,n
τ
}，将计算单元的取值设置为{1,
‑
1}，代表两种不同的状态：表示计算单元处于可分配状态；表示该计算单元所占有的计算资源已被占有，即已经完成分配，此时已处于非空闲状态，不可继续分配；其特征在于，所述资源分配方法是以获得最优的计算资源分配方案为目标，即保证更多的任务请求数据能够在MEC系统中尽快得到处理，从而达到最小的系统总开销；基于目标采用深度强化学习的方式进行卸载任务资源分配，深度强化学习的具体实现方式为基于马尔可夫模型：状态设计：建立马尔可夫状态空间s＝{L,C}，其中，L具体为一个n
o
行3列的矩阵；C具体为一个n
c
行n
τ
列矩阵；动作空间：建立马尔可夫动作空间其中，{δ
τ
,...

【专利技术属性】
技术研发人员：张瑛，刘颖青，曾瑞雪，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人