一种数据处理方法及装置、存储介质制造方法及图纸

技术编号:31796797 阅读:17 留言:0更新日期:2022-01-08 10:56
本申请实施例提供了一种数据处理方法及装置、存储介质,包括:分别获取深度学习加速器的硬件参数和神经网络模型中第一算法层对应的算法层参数;深度学习加速器用于运行神经网络模型;根据硬件参数和算法层参数,对多种数据调度方式下的访存次数进行比较,得到比较结果;基于比较结果,从多种数据调度方式中确定第一算法层在深度学习加速器上的目标数据调度方式。度方式。度方式。

【技术实现步骤摘要】
一种数据处理方法及装置、存储介质


[0001]本申请涉及深度学习领域,尤其涉及一种数据处理方法及装置、存储介质。

技术介绍

[0002]深度学习能够使机器模仿视听和思考等人类活动,解决了很多复杂的模式识别难题,深度学习所使用的神经网络在自然语言处理、图像识别、语音识别、数据挖掘等多个
取得了非常大的进展。目前,对于深度学习加速器,在执行神经网络模型时,采用固定的数据调度方式,导致每层算法层在执行时的性能差别大,进而增加了硬件功耗。

技术实现思路

[0003]本申请实施例提供一种数据处理方法及装置、存储介质,能够减少硬件功耗。
[0004]本申请的技术方案是这样实现的:
[0005]第一方面,本申请实施例提出一种数据处理方法,所述方法包括:
[0006]分别获取深度学习加速器的硬件参数和神经网络模型中第一算法层对应的算法层参数;所述深度学习加速器用于运行所述神经网络模型;
[0007]根据所述硬件参数和所述算法层参数,对多种数据调度方式下的访存次数进行比较,得到比较结果;
[0008]基于所述比较结果,从所述多种数据调度方式中确定所述第一算法层在所述深度学习加速器上的目标数据调度方式。
[0009]第二方面,本申请实施例提出一种数据处理装置,所述数据处理装置中部署上述的深度学习加速器;所述深度学习加速器为计算单元阵列;
[0010]所述计算单元阵列中沿第一方向上的每一组计算单元中依次加载一个通道对应的一组卷积核数据和一个通道对应的一个滑动窗口内的窗口特征数据;
[0011]所述计算单元阵列中沿第二方向的每一组计算单元中依次处理一个卷积核中一组通道对应的一组卷积核数据和一个滑动窗口对应的一组通道中的一组窗口特征数据;所述计算单元阵列中沿第二方向的一组计算单元进行级联,以对一组计算单元中每一个计算单元的输出特征数据进行累加操作,得到一组计算单元对应的一个输出特征数据。
[0012]第三方面,本申请实施例提出一种数据处理装置,所述数据处理装置包括:
[0013]获取单元,用于分别获取深度学习加速器的硬件参数和神经网络模型中第一算法层对应的算法层参数;所述深度学习加速器用于运行所述神经网络模型;
[0014]比较单元,用于根据所述硬件参数和所述算法层参数,对多种数据调度方式下的访存次数进行比较,得到比较结果;
[0015]确定单元,用于基于所述比较结果,从所述多种数据调度方式中确定所述第一算法层在所述深度学习加速器上的目标数据调度方式。
[0016]第四方面,本申请实施例提出一种数据处理装置,其特征在于,所述装置包括:处理器、存储器及通信总线;所述处理器执行存储器存储的运行程序时实现如上述数据处理
方法。
[0017]第五方面,本申请实施例提出一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现上述数据处理方法。
[0018]本申请实施例提供了一种数据处理方法及装置、存储介质,该方法包括:分别获取深度学习加速器的硬件参数和神经网络模型中第一算法层对应的算法层参数;深度学习加速器用于运行神经网络模型;根据硬件参数和算法层参数,对多种数据调度方式下的访存次数进行比较,得到比较结果;基于比较结果,从多种数据调度方式中确定第一算法层在深度学习加速器上的目标数据调度方式。采用上述实现方案,根据深度学习加速器的硬件参数和第一算法层对应的算法层参数,分析多种数据调度方式下的数据流,得到多种数据调度方式之间的访存次数比较结果,由于访存次数极大的影响了数据传输的能耗,因此基于比较结果确定出的目标数据调度方式考虑了第一算法层在深度学习加速器上的访存次数,能够提高算法层在深度学习加速器上执行的性能,进而减少硬件功耗。
附图说明
[0019]图1为一种权重数据复用方式的卷积示意图一;
[0020]图2为一种权重数据复用方式的卷积示意图二;
[0021]图3为一种权重数据复用方式的卷积示意图三;
[0022]图4为一种权重数据复用方式的卷积示意图四;
[0023]图5为一种输入特征数据复用方式的卷积示意图一;
[0024]图6为一种输入特征数据复用方式的卷积示意图二;
[0025]图7为一种输入特征数据复用方式的卷积示意图三;
[0026]图8为本申请实施例提供的一种数据处理方法的流程图;
[0027]图9为本申请实施例提供的一种4
×
4的计算单元阵列的示意图;
[0028]图10为本申请实施例提供的一种计算单元的单元结构示意图;
[0029]图11为本申请实施例提供的一种将卷积运算映射到计算单元的示意图;
[0030]图12为本申请实施例提供的一种权重数据复用中将数据流映射到深度学习加速器的示意图;
[0031]图13为本申请实施例提供的一种输入特征数据复用中将数据流映射到深度学习加速器的示意图;
[0032]图14为本申请实施例提供的一种数据处理装置1的结构示意图一;
[0033]图15为本申请实施例提供的一种数据处理装置1的结构示意图二。
具体实施方式
[0034]应当理解,此处描述的具体实施例仅仅用以解释本申请。并不用于限定本申请。
[0035]目前,数据调度方式包括权重数据复用和输入特征数据复用两种方式,以下针对两种数据调度方式进行具体说明。
[0036]对于权重数据复用方式而言,复用准则为先将一个卷积核中的一组通道输入读取计算单元中,接着开始遍历输入特征图像数据,特征图像窗口沿着水平方向或者竖直方向进行遍历,遍历完成之后,切换到下一个通道组,等待一个卷积核中所有通道都遍历完成之
后,再进行卷积核的切换。
[0037]具体的,首先固定卷积核0的通道0,之后在通道0对应的输入特征数据中开始遍历滑动窗口,参考图1,可以从输入特征数据中最左边的滑动窗口开始滑动;直至通道0对应的输入特征数据中所有滑动窗口完成计算,如图2所示,此时,对于输出特征数据而言,生成一个中间结果1;之后,如图3所示,切换到卷积核0的通道1,并遍历通道1对应的输入特征数据,生成一个中间结果2,中间结果1和中间结果2进行叠加得到叠加结果1,依次类推,如图4所示,直至切换到卷积核0的最后一个通道N,并遍历通道N对应的输入特征数据,生成一个中间结果N,中间结果N和叠加结果N

1进行叠加,得到卷积核0对应的一组输出特征数据。之后,再固定卷积核1执行上述操作。
[0038]对于输入特征数据复用方式而言,复用准则为先固定输入特征数据的一个通道组数据,将其加载到计算单元阵列中,接着遍历不同卷积核对应的通道组,遍历完成后,切换到下一个通道组,直至通道组便利为完成,再切换到下一个卷积核,直至卷积核全部遍历完成。
[0039]具体的,首先固定通道0对应的输入特征数据中左上角的滑动窗口,然后从通道0的卷积核0开始,参考权重复用方式的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:分别获取深度学习加速器的硬件参数和神经网络模型中第一算法层对应的算法层参数;所述深度学习加速器用于运行所述神经网络模型;根据所述硬件参数和所述算法层参数,对多种数据调度方式下的访存次数进行比较,得到比较结果;基于所述比较结果,从所述多种数据调度方式中确定所述第一算法层在所述深度学习加速器上的目标数据调度方式。2.根据权利要求1所述的方法,其特征在于,所述分别获取深度学习加速器的硬件参数和神经网络模型中第一算法层对应的算法层参数,包括:分别获取所述深度学习加速器中一个计算单元输出的特征图像的尺寸信息、所述深度学习加速器一次加载的卷积核数量与通道数;并将所述一个计算单元输出的特征图像的尺寸信息和所述深度学习加速器一次加载的卷积核数量确定为所述硬件参数;分别获取所述第一算法层对应的卷积核总数、所述第一算法层输出的特征数据的尺寸信息;并将所述第一算法层对应的卷积核总数、所述通道数和所述第一算法层输出的特征数据的尺寸信息确定为所述算法层参数。3.根据权利要求2所述的方法,其特征在于,所述根据所述硬件参数和所述算法层参数,对多种数据调度方式下的访存次数进行比较,得到比较结果,包括:根据所述一个计算单元输出的特征图像的尺寸信息和所述第一算法层输出的特征数据的尺寸信息,确定所述多种数据调度方式对应的权重数据访存次数之比;根据所述深度学习加速器一次加载的卷积核数量、所述第一算法层对应的卷积核总数和一个计算单元输出的特征图像的宽度信息,确定所述多种数据调度方式对应的输入特征数据访存次数之比;所述一个计算单元输出的特征图像的宽度信息为所述一个计算单元输出的特征图像的尺寸信息中的宽度信息。4.根据权利要求3所述的方法,其特征在于,所述基于所述比较结果,从所述多种数据调度方式中确定所述第一算法层在所述深度学习加速器上的目标数据调度方式,包括:基于所述多种数据调度方式对应的权重数据访存次数之比和所述多种数据调度方式对应的输入特征数据访存次数之比,确定所述多种数据调度方式中访存次数最少的数据调度方式,以作为所述第一算法层在所述深度学习加速器上的目标数据调度方式。5.根据权利要求1所述的方法,其特征在于,所述分别获取深度学习加速器的硬件参数和神经网络模型中第一算法层对应的算法层参数之前,所述方法还包括:确定对硬件资源的多种排列组合方式和所述多种排列组合方式对应的多组硬件参数;并获取所述第一算法层的初始算法层参数;基于预设算法性能指标和预设硬件性能指标...

【专利技术属性】
技术研发人员:祝叶华孙炜
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1