【技术实现步骤摘要】
用于边缘计算系统的模型训练方法、装置、设备和计算机可读介质
[0001]本专利技术涉及计算机
,特别涉及一种用于边缘计算系统的模型训练方法、装置、设备和计算机可读介质。
技术介绍
[0002]近年来,随着智能设备的飞速发展以及广泛普及,传统的数据处理方式难以满足日益增长的计算需求,移动终端(MD)的盛行对于移动网络、无线网络以及触发器有很大的影响。为了减轻移动终端的运行负荷,技术人员将大量的计算任务从移动终端(MD)上卸载并传输到附近的接入点(AP)、基站等边缘服务器上,这一过程被称为移动边缘计算(Mobile Edge Computing)。移动边缘计算(MEC)能够分担移动端的计算压力,可以有效避免了移动端的任务溢出和超长等待时间等问题。目前,边缘计算已经广泛应用于智能交通、智慧医疗、智能电网、智能工厂、智能城市等关键领域,是我国国民经济、现代社会以及国家安全的重要基础设施的核心系统。
[0003]移动边缘计算技术的核心问题之一是边缘计算卸载问题,边缘计算卸载问题用于确定计算任务是否需要从MD上卸载至边缘服务器上。对于接入设备的模型训练,相关方法中,比如博弈论,往往自适应性低,而深度强化学习计算复杂度高,收敛速度慢,不适用于对时间要求高的无线设备。
技术实现思路
[0004]本专利技术实施例提供了一种用于边缘计算系统的模型训练方法、装置、设备和计算机可读介质。所述技术方案如下:
[0005]第一方面,提供了一种用于边缘计算系统的模型训练方法,所述方法包括:
[0006 ...
【技术保护点】
【技术特征摘要】
1.一种用于边缘计算系统的模型训练方法,其特征在于,包括:训练移动设备中的子网络模型,获得所述子网络模型的目标模型参数;将所述目标模型参数传输至接入计算设备中,更新所述接入计算设备中的公共网络模型;判断所述子网络模型是否满足模型更新条件,若满足,则获取所述公共网络模型当前的公共模型参数,利用获取到的所述公共模型参数训练所述子网络模型。2.如权利要求1所述的方法,其特征在于,所述训练移动设备中的子网络模型,获得所述子网络模型的目标模型参数,包括:采用梯度下降法训练获得所述边缘计算系统的和计算率最大时的所述目标模型参数,所述和计算率采用如下公式计算:其中,R
t
为t时刻所述边缘计算系统的和计算率,γ∈(0,1]表示折扣因子,r
i
表示一个移动设备的计算率;r
i
@w
i
((1
‑
x
i
)R
L,i
(λ)+x
i
R
O,i
(λ,a
i
))其中,i∈N,表示第i个所述移动设备,w
i
为加权系数,R
L,i
(λ)表示第i个所述移动设备本地计算所述计算任务的效率,R
O,i
(λ,a
i
)表示第i个所述移动设备卸载所述计算任务的效率,λ={λ
i
|i∈N}。3.如权利要求2所述的方法,其特征在于,所述子网络模型包括:目标行为网络模型,所述目标行为网络模型训练的损失函数为:L
a
=
‑
Q(s
i
,μ
θ
(s))其中,s表示边缘计算网络的状态,s=h
i
,θ为所述目标行为网络模型的目标行为模型参数,μ
θ
(s)表示基于目标行为模型参数θ且边缘计算网络状态s的卸载策略函数,Q表示基于策略π和状态s做出的动作x
i,t
的动作值函数。4.如权利要求2所述的方法,其特征在于,所述子网络模型包括:目标评价网络模型、辅助评价网络模型和辅助行为网络模型;所述目标评价网络模型训练的损失函数根据所述目标评价网络模型的动作值函数以及所述辅助评价网络模型的动作值函数获得;所述目标评价网络模型的动作值函数根据所述目标行为网络模型的动作值函数获得,所述辅助评价网络模型的所述动作值函数根据所述辅助行为网络模型的动作值函数获得。5.如权利要求4所述的方法,其特征在于,所述目标评价网络模型训练的损失函数为:...
【专利技术属性】
技术研发人员:刘智斌,刘昱含,王心水,武骏豪,杨文涛,王进东,
申请(专利权)人:曲阜师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。