一种基于强化学习的资源分配方法组成比例

技术编号：40316657 阅读：22 留言：0更新日期：2024-02-07 20:59

本发明专利技术公开了一种基于强化学习的资源分配方法，包括：获取计算任务的任务特征和移动边缘计算服务器的资源负载，并建立LSTDPG长期短期确定性政策梯度模型，利用该模型对计算任务进行最小化处理，得到决策结果，根据决策结果，利用移动设备将计算任务卸载至相应移动边缘计算服务器进行计算并返回计算结果至移动设备，得到经验样本，利用经验样本对LSTDPG长期短期确定性政策梯度模型进行优化训练，直至达到最优决策结果。本发明专利技术利用长期短期确定性政策梯度模型，结合了时间注意力网络和基于情节的优先经验采样，能够捕获关键时间特征，加速学习过程，提高算法稳定性，具有更好的收敛性和性能表现，更加高效的资源分配和任务调度能力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于边缘服务器计算领域，具体涉及一种基于强化学习的资源分配方法。

技术介绍

1、近年来，移动边缘计算mec因其能够将任务从资源受限的移动设备md卸载到移动边缘计算服务器而成为一个热门话题。该计算方法能够减少延迟，节省能源消耗，并提高安全性，使其优于传统的移动云计算在移动边缘计算服务器和资源受限的移动设备的背景下确定最佳的任务卸载策略是一个紧迫的问题。随着任务规模和复杂性的增加，任务卸载的效率也随之变化。因此，需要一种有效的策略来在资源受限的边缘计算环境中卸载任务并优化资源利用率。为了解决这个问题，我们需要考虑多个方面，例如减轻计算负担、延长移动设备的电池寿命、最小化任务卸载延迟和功耗。需要一个考虑到各种因素的平衡解决方案。

技术实现思路

1、针对现有技术中的上述不足，本专利技术提供了一种基于强化学习的资源分配方法，能够减少移动用户数据处理中的服务延迟，有效地处理计算卸载和资源分配的联合优化。

2、为了达到上述专利技术目的，本专利技术采用的技术方案为：一种基于强化学习的...

【技术保护点】

1.一种基于强化学习的资源分配方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于强化学习的资源分配方法，其特征在于，所述S2的具体步骤如下：

3.根据权利要求2所述的基于强化学习的资源分配方法，其特征在于，所述移动边缘计算系统的状态的表达式如下：

4.根据权利要求2所述的基于强化学习的资源分配方法，其特征在于，所述任务分配至资源负载的动作的表达式如下：

5.根据权利要求2所述的基于强化学习的资源分配方法，其特征在于，所述LSTDPG长期短期确定性政策梯度模型包括TAN时间注意力网络，所述TAN时间注意力网络，包括：

...

【技术特征摘要】

1.一种基于强化学习的资源分配方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于强化学习的资源分配方法，其特征在于，所述s2的具体步骤如下：

3.根据权利要求2所述的基于强化学习的资源分配方法，其特征在于，所述移动边缘计算系统的状态的表达式如下：

4.根据权利要求2所述的基于强化学习的资源分配方法，其特征在于，所述任务分配至资源负载的动作的表达式如下：

5.根据权利要求2所述的基于强化学习的资源分配方法，其特征在于，所述lstdpg长期短期确定性政策梯度模型包括tan时间注意力网络，所述tan时间注意力网络，包括：

6.根据权利要求5所述的基于强化学习的资源分配方...

【专利技术属性】
技术研发人员：李强，雷祥，彭波，赵集，陈程，
申请(专利权)人：西南科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人