【技术实现步骤摘要】
一种基于多智能体的资源分配和任务卸载优化方法
[0001]本专利技术属于移动通信
,涉及一种基于多智能体的资源分配和任务卸载优化方法。
技术介绍
[0002]目前,第五代移动通信系统(5th Generation Mobile Communication System,5G)正快速部署并逐渐大规模商用,尽管5G移动通信系统在传输速率、连接密度、传输时延、能量效率等方面有了大幅度提升,但仍无法有力支撑如增强现实、虚拟现实、远程医疗、智慧城市、无人驾驶、在线游戏、智能工厂等以大数据和智能化为主要特征、以计算密集和时延敏感为主要特点的新兴产业的快速发展。与此同时,在物联网(Internet of Things,IoT)和移动互联网技术的推动下,网络边缘设备连接量以及数据流量急剧增长,业务计算云端化、连接泛在化和业务类型异构化的海量物联网应用对高效的移动通信网络和无线边缘网络资源分配构成一系列挑战。移动边缘计算(Mobile Edge Computing,MEC)作为一种新兴的计算模式,通过将全部或部分本地计算任务卸载到MEC服务器上,能显著提高用户的服务体验。
[0003]随着异构网络和MEC的融合,融合场景中的任务卸载和网络资源分配问题面临着新的挑战。一些主要的成果有:(1)可持续多接入边缘计算中一种新型的移动感知卸载管理方案(参考文献:Guan S,Boukerche A.A Novel Mobility
‑
aware Offloading Management Scheme in Su ...
【技术保护点】
【技术特征摘要】
1.一种基于多智能体的资源分配和任务卸载优化方法,其特征在于,所述方法包括:步骤1)针对异构网络环境中能量收集使能的MEC网络,分别建立计算任务模型,任务卸载到异构网络中的通信模型、任务执行模型和能耗模型,并根据建立的模型获得环境状态;步骤2)将边缘云服务器视为主方,根据获得的环境状态构建出主方的即时奖励函数,并根据主方的即时奖励函数建立主方执行协同资源分配决策的长期累积奖励的收益目标函数;步骤3)将移动设备视为从方,根据获得的环境状态构建出从方的即时奖励函数,并根据从方的即时奖励函数建立从方执行任务卸载决策的长期累积奖励的收益目标函数;步骤4)最大化主方的收益目标函数和从方的收益目标函数,结合主方和从方的决策约束条件,构建出斯塔克尔伯格博弈模型;步骤5)基于随机时变的网络环境和主从双方不完备的观测状态,将斯塔克尔伯格博弈模型建模为部分可观测马尔可夫决策过程博弈模型;步骤6)采用多智能体的深度强化学习算法求解部分可观测马尔可夫决策过程博弈模型,通过集中训练和分布式执行方式,学习并优化边缘云资源协作分配决策和移动设备任务卸载决策。2.根据权利要求1所述的一种基于多智能体的资源分配和任务卸载优化方法,其特征在于,所述环境状态包括边缘云服务器的可用计算资源和无线信道增益;移动设备的位置、任务积压、可用能量以及在收集的能量。3.根据权利要求1所述的一种基于多智能体的资源分配和任务卸载优化方法,其特征在于,所构建出的斯塔克尔伯格博弈模型表示为:在于,所构建出的斯塔克尔伯格博弈模型表示为:s.t.a
i
(t)∈{
‑
1,0,1}1,0,1}1,0,1}1,0,1}其中,F(t)为边缘云服务器的计算资源分配策略集合,B(t)为边缘云服务器的带宽资源分配策略集合;a(t)为移动设备任务卸载策略集合;R
L
表示边缘云服务器的长期累积奖励的收益,r
L
(t)表示在时隙t中边缘云服务器的即时奖励;表示移动设备i的长期累积奖励的收益,r
iF
(t)表示在时隙t中移动设备i的即时奖励,表示网络中的移动设备集合;a
i
(t)表示移动设备i在时隙t的任务卸载策略;1{x}是一个指示函数,当条件x为真时等于1,否则等于0;f
i0
(t)表示MBS在时隙t中分配给移动设备i的计算资源,B
i0
(t)表示MBS在时隙t中分配给移动设备i的带宽资源;表示MBS的最大计算能力,表示MBS的可用带宽资源;f
ij
(t)表示FBSj在时隙t中分配给移动设备i的计算资源;表示FBSj的最大计算能
力;B
ij
(t)表示FBSj在时隙t中分配给移动设备i的带宽资源;表示FBSj的可用带宽资源;表示FBSj覆盖范围内的移动设备集合;m表示移动设备总数,MBS表示宏基站,FBSj表示第j个毫微微基站。4.根据权利要求1或3所述的一种基于多智能体的资源分...
【专利技术属性】
技术研发人员:夏士超,姚枝秀,左琳立,李云,吴广富,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。