【技术实现步骤摘要】
一种基于深度强化学习的移动边缘计算任务分配方法
[0001]本专利技术涉及无线通信
,尤其涉及一种基于深度强化学习的移动边缘计算任务分配方法。
技术介绍
[0002]随着移动应用的迅速发展,越来越多的移动应用任务日趋计算密集和延迟敏感性。然而,这些任务可能对计算和电池能力有限的用户设备带来巨大挑战。为了应对这些挑战,移动边缘计算已被视为云计算的扩展,用于移动网络中的数据计算和通信。移动边缘计算将服务器放置在移动网络边缘,并提供计算和存储资源。服务器将更方便地提供计算服务来处理用户设备的密集计算任务,从而降低服务时延和更好的服务质量。
[0003]然而,现有移动边缘计算系统考虑单个边缘云的任务分配场景。由于有限的计算和能量容量,单一边缘云可能提供非常有限的任务分配性能,多边缘云协同研究的场景会更合适。同时,几乎所有现有的研究都集中在具有固定用户设备的静态边缘计算系统上。实际上,用户设备在计算过程中总是四处走动,这使得很难获得最佳策略,由此可知,现有技术中的方法存在较难适应环境动态性的技术问题。
专利技术内 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习的移动边缘计算任务分配方法,其特征在于,包括:S1:建立多边缘云协作移动边缘计算任务分配优化问题模型,其中,优化问题模型包括约束条件和目标,约束条件包括:每个参与终端设备计算的边缘云的计算任务比例在[0,1]之间,所有参与终端设备计算的边缘云的计算任务比例之和为1,为每个处理终端设备任务的边缘云所分配的计算资源在[0,F]之间;为所有处理终端设备任务的边缘云所分配的计算资源总和为F;目标为以延迟和能量消耗的总和最小化;S2:将移动边缘计算任务分配问题建模为马尔可夫决策过程;S3:将深度强化学习策略引入到移动边缘计算任务分配,通过观察当前时刻各终端设备计算任务完成情况,从历史经验中学习,选择下一时刻的最佳任务分配策略,以实现移动边缘计算任务的智能分配。2.如权利要求1所述的移动边缘计算任务分配方法,其特征在于,步骤S1包括:定义t时刻,第m个终端设备和控制中心之间的数据速率R
m
(t):其中,移动边缘计算系统由M个终端设备、K个边缘云和1个控制中心组成,上行带宽B
u
平均分配给每个终端设备,P
m
是终端设备m的发射功率,h
m
(t)为第m个终端设备和控制中心之间的信道增益,为边缘云端的噪声水平;定义t时刻,第m个终端设备和控制中心之间的任务传输能耗E
m
(t):其中,T
m
(t)为第m个终端设备和控制中心之间的任务传输延迟,D
m
为任务数据大小,R
m
(t)为任务数据的传输数据速率,P
r
是控制中心的接收功率;定义t时刻,第k个边缘云处理第m个终端设备任务的计算延迟第m个终端设备任务的计算延迟其中,为第k个边缘云参与第m个终端设备的计算任务比例,为第k个边缘云处理第m个终端设备任务所分配的计算资源,C
m
为第m个终端设备处理1bit任务所需的CPU周期数;根据第m个终端设备和控制中心之间的任务传输延迟、第k个边缘云处理第m个终端设备任务所分配的计算资源,获得第k个边缘云处理第m个终端设备任务的能耗备任务所分配的计算资源,获得第k个边缘云处理第m个终端设备任务的能耗其中,κ≥0为有效的开关电容;获取系统总能耗E(t)以及系统总时延T(t),
根据系统总能耗和系统总时延获得系统完成计算任务所消耗的总成本为U(t)=w1E(t)+w2T(t),其中,w1和w2分别是能耗和时延的权重,且w1+w2=1;通过联合计算任务和计算资源分配,构建多边缘云协作移动边缘计算任务分配优化问题模型,移动边缘计算任务分配优化问题模型的目标为最小化系统总成本,即:s.t.s.t.s.t.s.t.其中,F为每个边缘云最大的计算资源。3.如权利要求1所述的移动边缘计算任务分配方法,其特征在于,步骤S2包括:移动边缘计算任务分配问题转化为一个马尔可夫决策过程(S;A;p...
【专利技术属性】
技术研发人员:赵楠,季英强,白茂森,曾春艳,刘聪,胡胜,王娟,
申请(专利权)人:湖北工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。