当前位置: 首页 > 专利查询>贵州大学专利>正文

基于深度强化学习的多任务卸载方法、系统及设备技术方案

技术编号:43979582 阅读:19 留言:0更新日期:2025-01-10 20:04
本申请公开了一种基于深度强化学习的多任务卸载方法、系统及设备,所述方法包括:构建多接入边缘计算任务卸载场景,对用户终端计算任务进行有向无环图建模,利用编码器将任务转换为序列,通过贪心算法排序并进行特征提取;基于特征设置结构化状态空间模型,定义状态变换矩阵,引入时间尺度参数进行离散化,并通过全局卷积过程,构建基于注意力机制的深度强化学习网络架构;利用构建的网络架构定义状态空间和动作空间,构建奖励函数,采用近似策略优化算法进行策略优化,引入广义优势估计方法降低策略梯度方差。通过本申请的方案,能够快速适应动态卸载场景快速适应,对新的学习任务具有高效的卸载任务推理能力。

【技术实现步骤摘要】

本申请涉及机器学习领域,尤其涉及一种基于深度强化学习的多任务卸载方法、系统及设备


技术介绍

1、近年来,传感和通信技术的迅速发展为实现真正的数字时代开辟了许多应用的可能性,承载应用的各类ue(user equipment)已经成为人类生活中不可或缺的一部分。云计算技术因其具有充裕的计算能力而成为满足运行在ue中的资源密集型应用计算需求的候选者之一,但由于ue与云之间的传播延迟,云端无法满足这些应用的延迟需求。因此,资源密集型的移动应用对传统云数据中心在计算、存储和网络资源方面带来巨大挑战。具体来说,人脸识别、增强现实、虚拟现实、自动驾驶汽车、工业物联网等应用都在用户侧和云计算侧产生了巨大的网络传输瓶颈,最终导致非常高的服务延迟,造成了糟糕的用户体验。多接入边缘计算已经成为解决上述问题的关键技术方法。边缘计算技术将云计算能力扩展到离用户侧更近的边缘节点,并将应用程序的计算密集型任务从用户侧设备卸载到最近网络节点上的边缘计算主机,能明显的缓解网络拥塞和服务延迟。

2、然而,边缘计算服务器不像云服务器那样资源丰富,特别是在资源有限的动态边缘环境中,本文档来自技高网...

【技术保护点】

1.一种基于深度强化学习的多任务卸载方法,其特征在于,包括:

2.根据权利要求1所述的多任务卸载方法,其特征在于,其中,构建多接入边缘计算任务卸载场景,对用户终端计算任务进行有向无环图建模,利用编码器将任务转换为序列,通过贪心算法排序并进行特征提取,包括:

3.根据权利要求1所述的多任务卸载方法,其特征在于,其中,基于特征设置结构化状态空间模型,定义状态变换矩阵,引入时间尺度参数进行离散化,并通过全局卷积过程,构建基于注意力机制的深度强化学习网络架构,包括:

4.根据权利要求1所述的多任务卸载方法,其特征在于,其中,利用构建的网络架构定义状态空间和动作...

【技术特征摘要】

1.一种基于深度强化学习的多任务卸载方法,其特征在于,包括:

2.根据权利要求1所述的多任务卸载方法,其特征在于,其中,构建多接入边缘计算任务卸载场景,对用户终端计算任务进行有向无环图建模,利用编码器将任务转换为序列,通过贪心算法排序并进行特征提取,包括:

3.根据权利要求1所述的多任务卸载方法,其特征在于,其中,基于特征设置结构化状态空间模型,定义状态变换矩阵,引入时间尺度参数进行离散化,并通过全局卷积过程,构建基于注意力机制的深度强化学习网络架构,包括:

4.根据权利要求1所述的多任务卸载方法,其特征在于,其中,利用构建的网络架构定义状态空间和动作空间,构建奖励函数,采用近似策略优化算法进行策略优化,引入广义优势估计方法降低策略梯度方差,包括:

5.根据权利要求1所述的多任务卸载方法,其特征在于,其中,初始化网络参数,从数据集获取样本批次,生成动作和值估计,计算广义优势估计,更新策略网络参数以最小化损失函数,包括:

6.根据权利...

【专利技术属性】
技术研发人员:季卿李少波陈澈杨静胡丙齐麻兴江黄子宸刘琳
申请(专利权)人:贵州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1