数据协作处理方法、系统、装置、设备及存储介质制造方法及图纸

技术编号:34443166 阅读:74 留言:0更新日期:2022-08-06 16:35
本申请涉及一种数据协作处理方法、系统、装置、设备及存储介质;其中,所述方法包括:获取待处理的数据以及获取待拆分的目标深度神经网络模型;获取所述终端设备的当前内存运行情况;根据所述当前内存运行情况,将所述深度神经网络模型划分为第一部分网络层和第二部分网络层,得到分区结果;其中,所述第一部分网络层在所述终端设备上运行;所述第二部分网络层在边缘计算设备上运行;将所述分区结果发送到所述边缘计算设备中,以使得所述边缘计算设备和所述终端设备根据所述分区结果协作完成对所述数据的处理。本申请用以解决现有技术中,终端设备硬件和计算能力的限制导致性能差的技术问题。的技术问题。的技术问题。

【技术实现步骤摘要】
数据协作处理方法、系统、装置、设备及存储介质


[0001]本申请涉及机器学习
,尤其涉及一种数据协作处理方法、系统、装置、设备及存储介质。

技术介绍

[0002]近年来,深度神经网络(DNN)被广泛地应用在各种领域。以DNN为核心的应用程序要求终端设备具备强大的计算能力,但是,目前终端设备由于硬件和计算能力的限制,即便是采用较小的DNN模型,也会出现延时较大的情况,导致终端设备性能较差,无法实时处理图像、视频等数据。

技术实现思路

[0003]本申请提供了一种数据协作处理方法、系统、装置、设备及存储介质,用以解决现有技术中,终端设备硬件和计算能力的限制导致性能差的技术问题。
[0004]第一方面,本申请实施例提供了一种数据协作处理方法,适用于终端设备,所述方法包括:
[0005]获取待处理的数据以及获取待拆分的目标深度神经网络模型;
[0006]获取所述终端设备的当前内存运行情况;
[0007]根据所述当前内存运行情况,将所述深度神经网络模型划分为第一部分网络层和第二部分网络层,得到分区结果本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据协作处理方法,其特征在于,适用于终端设备,所述方法包括:获取待处理的数据以及获取待拆分的目标深度神经网络模型;获取所述终端设备的当前内存运行情况;根据所述当前内存运行情况,将所述深度神经网络模型划分为第一部分网络层和第二部分网络层,得到分区结果;其中,所述第一部分网络层在所述终端设备上运行;所述第二部分网络层在边缘计算设备上运行;将所述分区结果发送到所述边缘计算设备中,以使得所述边缘计算设备和所述终端设备根据所述分区结果协作完成对所述数据的处理。2.根据权利要求1所述的数据协作处理方法,其特征在于,所述根据所述当前内存运行情况,将所述深度神经网络模型划分为第一部分网络层和第二部分网络层,包括:获取所述目标深度神经网络模型的各网络层,在所述终端设备的所述当前内存运行情况下,各自的第一预测延迟时间,以及各网络层在所述边缘计算设备中各自的第二预测延迟时间;根据各所述第一预测延迟时间和各所述第二预测延迟时间,以所述深度神经网络模型整体的预测延迟时间最短为目标,确定在所述终端设备上运行的所述深度神经网络模型的第一部分网络层,以及在所述边缘计算设备上运行的第二部分网络层。3.根据权利要求2所述的数据协作处理方法,其特征在于,所述获取所述目标深度神经网络模型的各网络层,在所述终端设备的所述当前内存运行情况下,各自的第一预测延迟时间,以及各网络层在所述边缘计算设备中各自的第二预测延迟时间,包括:获取所述目标深度神经网络模型的各网络层各自对应的第一延迟时间预测模型和第二延迟时间预测模型;其中,所述第一延迟时间预测模型为所述网络层在所述终端设备中运行时的延迟时间预测模型;所述第二延迟时间预测模型为所述网络层在所述边缘计算设备中运行时的延迟时间预测模型;利用所述第一延迟时间预测模型,预测在所述当前内存运行情况下,所述目标深度神经网络模型的各网络层在所述终端设备中各自的第一预测延迟时间;利用所述第二延迟时间预测模型,预测所述目标深度神经网络模型的各网络层在所述边缘计算设备中各自的第二预测延迟时间。4.根据权利要求3所述的数据协作处理方法,其特征在于,所述获取所述目标深度神经网络模型的各网络层各自对应的第一延迟时间预测模型和第二延迟时间预测模型,包括:获取所述目标深度神经网络模型的目标模型特征信息;获取预先存储的对应关系信息;其中,所述对应关系信息中包括:各模型特征信息各自对应的各网络层的第一延迟时间预测模型和第二延迟时间预测模型;从所述对应关系信息中,确定所述目标模型特征信息对应的各网络层的第一延迟时间预测模型和第二延迟时间预测模型。5.根据权利要求4所述的数据协作处理方法,其特征在于,所述获取预先存储的对应关系信息,包括:对于任意一种深度神经网络模型的每一个网络层,进行如下处理:获取多个训练数据;获取在所述终端设备的不同内存运行情况下,所述网络层对各所述训练数据进行计算的第一延时;
根据各所述第一延时以及与所述终端设备的各所述内存运行情况,拟合得到所述第一延迟时间预测模型;获取所述边缘计算设备发送的各网络层的第二延迟时间预测模型;其中,所述第二延迟时间预测模型为所述边缘计算设备根据所述网络层在所述边缘计算设备中,对各所述训练数据进行计算得到的第二延时拟合得到;对应存储各所述深度神经网络模型的模型特征信息各自对应的第一延迟时间预测模型和第二延迟时间预测模型,得到所述对应关系信息。6.根据权利要求1~...

【专利技术属性】
技术研发人员:赵昆
申请(专利权)人:西安广和通无线通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1