【技术实现步骤摘要】
一种数据处理方法及装置、存储介质
本申请涉及计算机领域,尤其涉及一种数据处理方法及装置、存储介质。
技术介绍
卷积计算在整个卷积神经网络中的时间占比最高,较高的计算量是制约其应用的因素之一;在卷积计算过程中存在大量的数据被重复使用,在设计针对卷积神经网络加速的处理器时,利用数据可复用的特性能够减少访问片外存储器的次数。然而,随着实际应用场景的越加复杂以及实际应用场景对精度要求的提高,卷积神经网络的网络拓扑结构不断变化,处理器中固定的数据复用方式与多样的卷积神经网络结构之间存在失配问题,使得整体的数据复用效果较差,进而降低处理器的性能,增加能耗。
技术实现思路
本申请实施例提供一种数据处理方法及装置、存储介质,能够提高处理器执行卷积计算时的性能,减少能耗。本申请的技术方案是这样实现的:本申请实施例提供一种数据处理方法,所述方法包括:获取卷积神经网络的网络结构参数和处理器的处理器参数;并根据所述网络结构参数和所述处理器参数,设置目标优化算法的约束条件,所述目标优化算法中的优化目标包括处理器能耗和/或处理器性能;基于所述约束条件执行所述目标优化算法,得到所述卷积神经网络对应的数据复用方式;根据所述数据复用方式,调度所述处理器执行所述卷积神经网络对应的卷积计算。本申请实施例提供一种数据处理装置,所述数据处理装置包括:数据获取单元,用于获取卷积神经网络的网络结构参数和处理器的处理器参数;约束条件设置单元,用于根据所述网络结构参数和所述处 ...
【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取卷积神经网络的网络结构参数和处理器的处理器参数;并根据所述网络结构参数和所述处理器参数,设置目标优化算法的约束条件,所述目标优化算法中的优化目标包括处理器能耗和/或处理器性能;/n基于所述约束条件执行所述目标优化算法,得到所述卷积神经网络对应的数据复用方式;/n根据所述数据复用方式,调度所述处理器执行所述卷积神经网络对应的卷积计算。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取卷积神经网络的网络结构参数和处理器的处理器参数;并根据所述网络结构参数和所述处理器参数,设置目标优化算法的约束条件,所述目标优化算法中的优化目标包括处理器能耗和/或处理器性能;
基于所述约束条件执行所述目标优化算法,得到所述卷积神经网络对应的数据复用方式;
根据所述数据复用方式,调度所述处理器执行所述卷积神经网络对应的卷积计算。
2.根据权利要求1所述的方法,其特征在于,所述约束条件包括:处理器能耗约束条件和/或处理器性能约束条件,所述基于所述约束条件执行所述目标优化算法,得到所述卷积神经网络对应的数据复用方式,包括:
执行所述目标优化算法,得到满足所述处理器能耗约束条件和/或所述处理器性能约束条件的所述数据复用方式。
3.根据权利要求1所述的方法,其特征在于,所述处理器参数包括所述处理器的存储层级;所述根据所述网络结构参数和所述处理器参数,设置目标优化算法的约束条件,包括:
根据所述处理器的存储层级确定所述卷积神经网络中卷积层对应的循环分块层数;
根据所述网络结构参数和所述处理器参数,对所述目标优化算法设置所述循环分块层数对应的约束条件。
4.根据权利要求3所述的方法,其特征在于,所述根据所述网络结构参数和所述处理器参数,对所述目标优化算法设置所述循环分块层数对应的约束条件,包括:
根据所述卷积神经网络对应的循环分块层数,确定所述卷积神经网络对应的循环分块参数,所述循环分块参数为输入特征图、所述卷积神经网络的卷积核和输出特征图对应的分块尺寸参数;
根据所述网络结构参数和所述处理器参数,对所述目标优化算法设置所述循环分块参数对应的循环分块参数约束条件;
将所述处理器能耗约束条件和/或所述处理器性能约束条件、和所述循环分块参数约束条件确定为所述循环分块层数对应的约束条件。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
执行所述目标优化算法,得到满足所述处理器能耗约束条件和/或所述处理器性能约束条件、和所述循环分块参数约束条件的循环分块参数值;
执行所述目标优化算法,得到满足所述处理器能耗约束条件和/或所述处理器性能约束条件的所述数据复用方式。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
根据所述数据复用方式和所述循环分块参数值,调度处理器执行所述卷积神经网络对应的卷积计算。
7.根据权利要求6所述的方法,其特征在于,所述根据所述数据复用方式、所述循环分块参数值,调度处理器执行所述卷积神经网络对应的卷积计算,包括:
根据所述循环...
【专利技术属性】
技术研发人员:刘君,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。