【技术实现步骤摘要】
边缘计算卸载方法及装置
[0001]本专利技术涉及隐私保护、计算卸载与机器学习
,尤其涉及一种边缘计算卸载方法及装置。
技术介绍
[0002]随着边缘计算技术的高速发展,许多新兴技术与程序被加载在各类便捷式移动设备上,这些便捷式移动设备要求更低的时延和能耗,同时,还需要满足一定的隐私保护标准,其中,边缘计算是物联网的核心技术之一,通过将某个终端设备中计算任务或数据迁移到资源更丰富的网络边缘服务器,从而实现增强移动设备综合性能的目的。
[0003]在这种架构下,用户需要在诸多参与方设备之间进行选择和卸载,通过参与方提供的网络、硬件等参数选择最优的任务调度方案。然而,由于可信的要求,参与方没有提供部分关键参数,或者,参与方将参数通过差分隐私或k
‑
匿名技术进行泛化加噪;同时,隐私保护也导致了恶意结点、故障结点不易被发现。
[0004]由此可知,亟需一种高效的边缘计算卸载方式。
技术实现思路
[0005]有鉴于此,本专利技术实施例提供一种边缘计算卸载方法及装置,以实现降低系统 ...
【技术保护点】
【技术特征摘要】
1.一种边缘计算卸载方法,其特征在于,应用于需求方,所述需求方为进行边缘计算时发起计算卸载请求的节点,所述方法包括:根据当前卸载任务发起计算卸载请求,并通过基站将所述计算卸载请求发送给其他参与边缘计算的节点,将响应所述计算卸载请求的节点作为参与方,所述参与方由所述基站进行匿名化,所述当前卸载任务至少包括卸载任务量;接收所述参与方发送的经加噪保护后的性能参数,以及接收所述基站发送的每个所述参与方的历史服务评分;结合所述卸载任务量,将每个所述性能参数和对应的历史服务评分编码成预先建立的马尔科夫决策过程MDP中的状态空间向量;将所述状态空间向量输入至预先训练的深度确定性策略梯度DDPG决策模型进行卸载决策,输出已选参与方和卸载比例,所述深度确定性策略梯度DDPG决策模型由当前策略Actor网络μ、目标策略Actor网络μ'、当前值Critic网络Q和目标值Critic网络Q'组成;与所述已选参与方进行点对点连接,并根据所述卸载任务量、所述已选参与方和所述卸载比例进行任务卸载;若卸载成功,计算所述当前卸载任务的时延,所述已选参与方的成功次数加一;若卸载失败,所述已选参与方的失败次数加一;计算决策算法的平均时延和成功率,对所述决策算法的平均时延和成功率进行更新,并基于所述决策算法的平均时延和成功率更新所述已选参与方的历史服务评分。2.根据权利要求1所述的方法,其特征在于,所述根据所述卸载任务量、所述已选参与方和所述卸载比例进行任务卸载,包括:计算所述卸载任务量和所述卸载比例的乘积,得到第一数据量,所述第一数据量为需要在所述已选参与方上进行任务卸载的数据量;将所述第一数据量的数据传输至所述已选参与方,使所述已选参与方对所述第一数据量的数据进行任务卸载;计算所述需求方的卸载比例,并计算所述需求方的卸载比例和所述卸载任务量的乘积,得到第二数据量,所述第二数据量为需要在所述需求方上进行任务卸载的数据量;对所述第二数据量的数据进行任务卸载。3.根据权利要求2所述的方法,其特征在于,还包括:若所述卸载任务量超过所述已选参与方的可用缓冲区大小,确定卸载失败;或者,若所述已选参与方为恶意节点,确定卸载失败;或者,若未成功将所述第一数据量的数据传输至所述已选参与方,确定卸载失败;将所述当前卸载任务标记为失败,并利用R=
‑
10,得到所述当前卸载任务对应的奖励值。4.根据权利要求1所述的方法,其特征在于,所述计算所述当前卸载任务的时延,包括:获取传输速率、所述第一数据量、所述第二数据量、第三数据量、所述已选参与方的cpu计算频率fre、以及单位比特数据需要的时钟周期数cycle,其中,所述传输速率为将所述第一数据量的数据传输至所述已选参与方的速率,由香农公式计算得到,所述第三数据量为
所述已选参与方在接收所述第一数据量的数据时,缓冲区队列中等待处理的数据量;根据所述第二数据量、所述已选参与方的cpu计算频率fre以及所述单位比特数据需要的时钟周期数cycle,得到需求方本地处理时延;根据所述第一数据量、所述已选参与方的cpu计算频率fre以及所述单位比特数据需要的时钟周期数cycle,得到所述已选参与方的处理时延;根据所述第三数据量、所述已选参与方的cpu计算频率fre以及所述单位比特数据需要的时钟周期数cycle,得到排队时延;根据所述第二数据量和所述传输速率,得到传输时延;根据所述需求方本地处理时延、所述已选参与方的处理时延、所述排队时延以及所述传输时延,计算所述当前卸载任务的时延,其中,t
local
为所述需求方本地处理时延,t
pro
为所述已选参与方的处理时延,t
trans
为所述传输时延,t
que
为所述排队时延。5.根据权利要求1或4所述的方法,其特征在于,在所述计算所述当前卸载任务的时延之后,还包括:根据所述当前卸载任务的时延和所述已选参与方的历史服务评分,利用R=
‑
delay
‑
e
τ*(1
‑
sc)
,得到所述当前卸载任务对应的奖励值;其中,delay为所述当前卸载任务的时延,sc为所述已选参与方的历史服务评分,τ为超参数,是大于0的实数,用于调节所述已选参与方的历史服务评分对需求方选择参与方的影响程度。6.根据权利要求1所述的方法,其特征在于,所述计算决策算法的平均时延和成功率,对所述决策算法的平均时延和成功率进行更新,并基于所述决策算法的平均时延和成功率更新所述已选参与方的历史服务评分,包括:获取每次卸载任务的时延、所述已选参与方的成功次数和所述已选参与方的总次数;根据所述每次卸载任务的时延,计算所有卸载任务的总时延;根据所述所有卸载任务的总时延和所述已选参与方的成功次数,得到决策算法的平均时延,并对所述决策算法的平均时延进行更新;根据所述已选参与方的成功次数和所述已选参与方的总次...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。