一种DNN任务卸载的方法技术

技术编号：28495374 阅读：24 留言：0更新日期：2021-05-19 22:27

本发明专利技术实施例提供了一种DNN任务卸载的方法，包括：B1、移动端向边缘服务器发出任务卸载请求，获取边缘服务器反馈的将任务时段划分为多个时隙的信息；B2、移动端根据多个时隙的信息生成预期策略并获取邻居移动端的预期策略，预期策略中将DNN任务按层划分为在移动端本地执行的前期任务和在边缘服务器的相应时隙处理的后期任务；B3、移动端根据自身的预期策略和最新获得的邻居移动端的预期策略估算各时隙的服务处理时延，以自身成本最小化为优化目标更新预期策略，重复该步骤直至获得边缘服务器按照预设的规则确认移动端已获得最优预期策略的信号并将最新的预期策略作为卸载策略；B4、移动端根据卸载策略将后期任务中的子任务卸载到指定的时隙执行。卸载到指定的时隙执行。卸载到指定的时隙执行。

全部详细技术资料下载

【技术实现步骤摘要】
一种DNN任务卸载的方法

[0001]本专利技术涉及深度神经网络任务处理领域，具体来说涉及深度神经网络任务的任务拆分卸载领域，更具体地说，涉及一种DNN任务卸载的方法。

技术介绍

[0002]深度学习现在广泛应用于各种移动端，然而，大多数深度学习模型需要进行复杂的计算，在移动端上使用有限的计算资源很难计算其推理结果。因此，目前常用的方法是将深度学习任务卸载到云上，即移动云计算(Mobile Cloud Computing，简称MCC)，它具有丰富的计算资源和强大的计算能力，可以处理复杂的计算任务。然而，由于云通常远离移动端，处理时延通常大于100ms。这导致用户在使用对时延敏感的应用程序时的用户体验很差，这也是移动云计算的瓶颈。为了缓解这一问题，移动边缘计算(Mobile Edge Computing，简称MEC)应运而生，通过布置在移动端附近的单个或者多个边缘服务器接收并处理移动端卸载的任务，从而加快计算密集型任务的处理过程来减轻移动端的计算负担。
[0003]目前，随着深度学习技术的发展和移动端计算能力的不断增强，一些基于深度学习的应用被部署在移动端中，如苹果智能语音助手(Siri)和谷歌助理(Google Assistant)。但是，移动端的计算能力有限，一些移动端处理深度学习任务的时延较高，也可能让移动端的电量消耗过快，因此，将移动端上的深度学习任务卸载到边缘服务器上，是满足深度学习任务高计算量和低时延需求的一种可行方法。移动边缘计算中最直接的方法是将所有的计算从移动端转移到边缘服务器，目前已有许多研...

【技术保护点】

【技术特征摘要】
1.一种DNN任务卸载的方法，用于移动端的DNN任务卸载到边缘服务器的过程，其特征在于，该方法包括：B1、移动端向边缘服务器发出任务卸载请求，获取边缘服务器反馈的将任务时段划分为多个时隙的信息；B2、所述移动端根据多个时隙的信息生成预期策略并获取邻居移动端的预期策略，其中，预期策略中将DNN任务按层划分为在移动端本地执行的前期任务和在边缘服务器的相应时隙处理的后期任务；B3、所述移动端根据自身的预期策略和最新获得的邻居移动端的预期策略估算各时隙的服务处理时延，以自身成本最小化为优化目标更新预期策略，重复该步骤直至获得边缘服务器按照预设的规则确认移动端已获得最优预期策略的信号并将最新的预期策略作为卸载策略；B4、所述移动端根据卸载策略将后期任务中的子任务卸载到指定的时隙执行。2.根据权利要求1所述的DNN任务卸载的方法，其特征在于，预期策略采用以下拆分矩阵的形式设置：其中，y
i
表示移动端i的预期策略，i∈{1,
…
,N}，N表示移动端的数量，对于该拆分矩阵中的任意一个元素y
ijh
，j∈{1,
…
,M}，M表示DNN任务的层数，该拆分矩阵的各个行对应于DNN任务的各个子任务，h∈{0,1,
…
,H}，H表示时隙的数量，拆分矩阵的列包括对应于子任务在本地处理的列和对应于子任务卸载到边缘服务器的对应时隙的列，在拆分矩阵的元素中用第一数值表示该元素所在的行对应子任务按照该元素所在列对应的方式处理，用不同于第一数值的第二数值表示该元素所在的行对应子任务不由该元素所在列对应的方式处理。3.根据权利要求2的DNN任务卸载的方法，其特征在于，按照以下多个约束条件对移动端更新预期策略的范围进行限制：第一约束条件：DNN任务中在前执行的子任务分配的时隙不能位于在后执行的子任务分配的时隙之后；第二约束条件：更新的预期策略需要满足移动端的时延需求；第三约束条件：每个时隙内的子任务数量不能大于边缘服务器并行执行的子任务的最大数量；第四约束条件：一个移动端分配到同一个时隙的所有子任务的处理时延之和不能大于时隙的长度。4.根据权利要求2所述的DNN任务卸载的方法，其特征在于，所述步骤B3包括：B31、移动端对自身的预期策略和最新获得的邻居移动端的预期策略按照预设的时隙时延估算方式估算各时隙的服务处理时延；B32、所述移动端获取各个时隙的服务单价，根据最新估算的各时隙的服务处理时延以
自身成本最小化为优化目标更新预期策略，该成本包括时延成本、能耗成本和边缘服务价格成本；B33、所述移动端确认是否获得边缘服务器按照预设的规则确认移动端已获得最优预期策略的信号，其中，该信号是在边缘服务器...

【专利技术属性】
技术研发人员：高明晋，沈茹婧，齐文，周一青，石晶林，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人