【技术实现步骤摘要】
处理深度学习计算任务的方法、装置、设备和存储介质
本申请涉及计算机
,尤其涉及一种处理深度学习计算任务的方法、装置、设备和存储介质。
技术介绍
随着人工智能的广泛应用,很多深度学习模型用于移动终端业务,例如图像识别、VR、AR、语音识别等。由于调用深度学习模型进行计算通常需要传输大量的图像、音频或者视频数据,将深度学习模型部署在云端会导致较大的传输时延。目前学术界和工业界开始将模型直接部署在移动设备中完成运算,从而减少网络传输带来的开销。但是,常见的深度学习模型通常包含庞大的参数量,层数也非常多,资源有限的移动设备往往不能满足深度学习任务的计算和存储需求。神经网络压缩是解决这一问题的有效方法,通过剪枝、量化、卷积核分解等技术,减少参数量或运算量,得到轻量级的神经网络模型。但是神经网络压缩需要较高的设计技巧,在实际工程应用中过于复杂,同时模型在压缩之后往率的下降。随着边缘计算的发展,很多学者利用计算卸载技术将深度学习模型中的部分层卸载到边缘设备上。每个深度学习模型各不相同,卸载不同的深度学习模型需要采用不同的卸载 ...
【技术保护点】
1.一种处理深度学习计算任务的方法,其特征在于,所述方法包括:/n针对包含多个子任务的深度学习任务,获取所述深度学习任务的多个候选卸载策略,每个所述卸载策略中的各个子任务对应的卸载状态参数为保留参数或卸载参数;/n获取移动终端与目标边缘设备之间进行数据传输的传输参数;/n获取各个所述子任务分别在所述移动终端和所述目标边缘设备上执行时的预设执行参数;/n根据每个所述候选卸载策略中各个所述子任务的卸载状态参数、所述传输参数和所述预设执行参数,筛选出满足预设条件的候选卸载策略,以作为目标卸载策略。/n
【技术特征摘要】
1.一种处理深度学习计算任务的方法,其特征在于,所述方法包括:
针对包含多个子任务的深度学习任务,获取所述深度学习任务的多个候选卸载策略,每个所述卸载策略中的各个子任务对应的卸载状态参数为保留参数或卸载参数;
获取移动终端与目标边缘设备之间进行数据传输的传输参数;
获取各个所述子任务分别在所述移动终端和所述目标边缘设备上执行时的预设执行参数;
根据每个所述候选卸载策略中各个所述子任务的卸载状态参数、所述传输参数和所述预设执行参数,筛选出满足预设条件的候选卸载策略,以作为目标卸载策略。
2.根据权利要求1所述的方法,其特征在于,所述预设条件包括计算时长约束条件和能耗约束条件,所述根据每个所述候选卸载策略中各个所述子任务的卸载状态参数、所述传输参数和所述预设执行参数,筛选出满足预设条件的候选卸载策略,以作为目标卸载策略,包括:
根据每个所述候选卸载策略中各个所述子任务的卸载状态参数、所述传输参数和所述预设执行参数,计算得到各个候选卸载策略的运行时长和能耗;
从多个所述候选卸载策略中,筛选出所述能耗小于所述能耗约束条件中的预设能耗的候选卸载策略,作为第一候选卸载策略;
从所述第一候选卸载策略中筛选出满足所述计算时长约束条件的的候选卸载策略,作为所述目标卸载策略。
3.根据权利要求2所述的方法,其特征在于,所述传输参数包括实时传输速率和传输功率,所述预设执行参数包括计算时长和计算功率,所述深度学习任务X的l个子任务分别为x1,x2,...,xl,所述候选卸载策略的数量为N,第k个所述候选卸载策略的能耗Ek的计算公式具体如下:
其中,为第k个所述候选卸载策略中的第i个所述子任务的卸载状态参数,当和分别表示在所述移动终端和在所述目标边缘设备执行第k个所述候选卸载策略中的第i个所述子任务,Cin为所述深度学习任务的数据的输入量,Ci为第i个所述子任务的输出数据量,mti为第i个所述子任务在所述移动终端的计算时长,Vup和Vdown分别为所述移动终端上传速度和下载速度,Pi为第i个所述子任务在所述移动终端运行的计算功率,Pup和Pdown分别为所述移动终端的发射功耗和接收功耗,所述第一候选卸载策略的能耗满足Ek<E,E为所述预设能耗。
4.根据权利要求2所述的方法,其特征在于,所述传输参数包括实时传输速率和传输功率,所述预设执行参数包括计算时长和计算功率,所述深度学习任务X的l个子任务分别为x1,x2,...,xl,所述候选卸载策略的数量为N,第k个所述候选卸载策略的运行时长Tk计算公式具体如下:
其中,为第k个所述候选卸载策略中的第i个所述子任务的卸载状态参数,当和分别表示在所述移动终端和在所述目标边缘设备执行第k个所述候选卸载策略中的第i个所述子任务,Cin为所述深度学习任务的数据的输入量,Ci为第i个所述子任务的输出数据量,mti为第i个所述子任务在所述移动终端的计算时长,eti为第i个所述子任务在所述目标边缘设备的计算时长,Vup和Vdown分别为所述移动终端上传速度和下载速度。
5.根据权利要求1所述的方法,其特征在于,所述获取移动终端与目标边缘设备之间进行数据传输的传输参数之前,还包括:
获取所述深度学习任务对应的各个所述候选边缘设备的实时负载值;
根据所述实时负载值从多个所述候选边缘设备中,筛选最小的实时负载值对...
【专利技术属性】
技术研发人员:王绎超,方学阳,杨耀华,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。