一种数据处理方法及装置、存储介质制造方法及图纸

技术编号:26172048 阅读:13 留言:0更新日期:2020-10-31 13:47
本申请实施例提供了一种数据处理方法及装置、存储介质,该方法包括:获取卷积神经网络的网络结构参数和处理器的处理器参数;并根据网络结构参数和处理器参数,设置目标优化算法的约束条件,目标优化算法中的优化目标包括处理器能耗和/或处理器性能;基于约束条件执行目标优化算法,得到卷积神经网络对应的数据复用方式;根据数据复用方式,调度处理器执行卷积神经网络对应的卷积计算。

【技术实现步骤摘要】
一种数据处理方法及装置、存储介质
本申请涉及计算机领域,尤其涉及一种数据处理方法及装置、存储介质。
技术介绍
卷积计算在整个卷积神经网络中的时间占比最高,较高的计算量是制约其应用的因素之一;在卷积计算过程中存在大量的数据被重复使用,在设计针对卷积神经网络加速的处理器时,利用数据可复用的特性能够减少访问片外存储器的次数。然而,随着实际应用场景的越加复杂以及实际应用场景对精度要求的提高,卷积神经网络的网络拓扑结构不断变化,处理器中固定的数据复用方式与多样的卷积神经网络结构之间存在失配问题,使得整体的数据复用效果较差,进而降低处理器的性能,增加能耗。
技术实现思路
本申请实施例提供一种数据处理方法及装置、存储介质,能够提高处理器执行卷积计算时的性能,减少能耗。本申请的技术方案是这样实现的:本申请实施例提供一种数据处理方法,所述方法包括:获取卷积神经网络的网络结构参数和处理器的处理器参数;并根据所述网络结构参数和所述处理器参数,设置目标优化算法的约束条件,所述目标优化算法中的优化目标包括处理器能耗和/或处理器性能;基于所述约束条件执行所述目标优化算法,得到所述卷积神经网络对应的数据复用方式;根据所述数据复用方式,调度所述处理器执行所述卷积神经网络对应的卷积计算。本申请实施例提供一种数据处理装置,所述数据处理装置包括:数据获取单元,用于获取卷积神经网络的网络结构参数和处理器的处理器参数;约束条件设置单元,用于根据所述网络结构参数和所述处理器参数,设置目标优化算法的约束条件,所述目标优化算法中的优化目标包括处理器能耗和/或处理器性能;算法执行单元,用于基于所述约束条件执行所述目标优化算法,得到所述卷积神经网络对应的数据复用方式;卷积单元,用于根据所述数据复用方式,调度所述处理器执行所述卷积神经网络对应的卷积计算。本申请实施例提供一种数据处理装置,所述数据处理装置包括:处理器、存储器及通信总线;所述处理器执行存储器存储的运行程序时实现如上述数据处理方法。本申请实施例提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述数据处理方法。本申请实施例提供了一种数据处理方法及装置、存储介质,该方法包括:获取卷积神经网络的网络结构参数和处理器的处理器参数;并根据网络结构参数和处理器参数,设置目标优化算法的约束条件,目标优化算法中的优化目标包括处理器能耗和/或处理器性能;基于约束条件执行目标优化算法,得到卷积神经网络对应的数据复用方式;根据数据复用方式,调度处理器执行卷积神经网络对应的卷积计算。采用上述实现方案,数据处理装置根据卷积神经网络的网络结构参数和处理器的处理器参数设置了对处理器能耗和/或处理器性能进行优化的目标优化算法的约束条件,此时,执行目标优化算法得到的数据复用方式,是考虑了当前的卷积神经网络和处理器相关信息的,且该数据复用方式使得处理器能耗最小或者性能最优,进而利用该数据复用方式进行卷积计算时,数据复用效果好,进而提高处理器执行卷积计算时的性能,减少能耗。附图说明图1为本申请实施例提供的一种数据处理方法的流程图一;图2为本申请实施例提供的一种数据处理方法的流程图二;图3为本申请实施例提供的一种示例性的输入特征复用方式的示意图;图4为本申请实施例提供的一种示例性的卷积核复用方式的示意图;图5为本申请实施例提供的一种示例性的输出特征复用方法的示意图;图6为本申请实施例提供的一种数据处理方法的流程图三;图7为本申请实施例提供的一种示例性的对输入特征图、卷积核和输出特征图进行两层嵌套循环划分的示意图;图8为本申请实施例提供的一种示例性的数据处理装置基于目标优化算法智能选择数据复用方式和循环分块参数的过程;图9为本申请实施例提供的一种数据处理装置的结构示意图一;图10为本申请实施例提供的一种数据处理装置的结构示意图二。具体实施方式应当理解,此处描述的具体实施例仅仅用以解释本申请。并不用于限定本申请。为解决上述问题提出了本申请,具体的通过以下实施例进行论述。本申请实施例提供一种数据处理方法,如图1所示,该方法可以包括:S101、获取卷积神经网络的网络结构参数和处理器的处理器参数;并根据网络结构参数和处理器参数,设置目标优化算法的约束条件,目标优化算法中的优化目标包括处理器能耗和/或处理器性能。本申请实施例中,在初始化阶段,数据处理装置读取卷积神经网络的模型信息和处理器的架构信息,其中,处理器可以为用于实现卷积神经网络的卷积计算的深度学习处理器;之后,数据处理装置解析处理器的架构信息,得到处理器的处理器参数;数据处理装置解析卷积神经网络的参数信息,并将卷积神经网络的参数信息和卷积神经网络的模型信息确定为卷积神经网络的网络结构参数。本申请实施例中,卷积神经网络为卷积神经网络(ConvolutionalNeuralNetworks,CNN),CNN网络的网络结构可以根据实际情况进行变换,本申请实施例不做具体的限定。本申请实施例中,卷积神经网络的网络模型可以包括:网络层数,卷积层数,每层卷积核数量,卷积核尺寸等。本申请实施例中,卷积神经网络的网络结构参数可以包括:卷积步长,卷积方式,输入特征图尺寸,输出特征图尺寸等。本申请实施例中,处理器架构包括:计算模块、存储模块和控制模块等。本申请实施例中,处理器参数包括:MAC单元数量,片上缓存容量,访存带宽、存储层级等处理器硬件参数。其中,处理器的存储层级可以包括片外存储、片上一级缓存、片上二级缓存和片上三级缓存等,处理器的存储层级根据处理器的存储结构决定。本申请实施例中,数据处理装置中设置有目标优化算法,目标优化算法中的优化目标包括处理器能耗和/或处理器性能,该目标优化算法中的优化目标可以为一个优化目标,也可以为多个优化目标,具体的可以根据实际情况进行选择,本申请实施例不做具体的限定。例如若需要最大化神经网络的计算吞吐量,可以先优化计算能力,再优化能耗;若需要在能耗和性能之间取得折衷,可以将执行目标修改为综合考虑了性能和能耗的指标等。可选的,目标优化算法可以包括多目标粒子群算法、多目标进化算法等多目标优化算法,具体的根据实际情况进行选择,本申请实施例不做具体的限定。本申请实施例中,处理器性能包括:处理器计算能力和处理器对片外存储器的访存带宽等,具体的根据实际情况进行选择,本申请实施例不做具体的限定。本申请实施例中,目标优化算法的约束条件包括处理器能耗约束条件和/或处理器性能约束条件,其中,处理器性能约束条件可以包括对处理器计算能力的约束条件、对处理器对片外存储器的访存带宽的约束条件和/或对处理器的缓存容量的约束条件。处理器能耗的计算公式如公式(1)所示:Energy=NDRAM×EDRAM+NBuffer×EBuffer+NMAC×EMAC(1)<本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取卷积神经网络的网络结构参数和处理器的处理器参数;并根据所述网络结构参数和所述处理器参数,设置目标优化算法的约束条件,所述目标优化算法中的优化目标包括处理器能耗和/或处理器性能;/n基于所述约束条件执行所述目标优化算法,得到所述卷积神经网络对应的数据复用方式;/n根据所述数据复用方式,调度所述处理器执行所述卷积神经网络对应的卷积计算。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取卷积神经网络的网络结构参数和处理器的处理器参数;并根据所述网络结构参数和所述处理器参数,设置目标优化算法的约束条件,所述目标优化算法中的优化目标包括处理器能耗和/或处理器性能;
基于所述约束条件执行所述目标优化算法,得到所述卷积神经网络对应的数据复用方式;
根据所述数据复用方式,调度所述处理器执行所述卷积神经网络对应的卷积计算。


2.根据权利要求1所述的方法,其特征在于,所述约束条件包括:处理器能耗约束条件和/或处理器性能约束条件,所述基于所述约束条件执行所述目标优化算法,得到所述卷积神经网络对应的数据复用方式,包括:
执行所述目标优化算法,得到满足所述处理器能耗约束条件和/或所述处理器性能约束条件的所述数据复用方式。


3.根据权利要求1所述的方法,其特征在于,所述处理器参数包括所述处理器的存储层级;所述根据所述网络结构参数和所述处理器参数,设置目标优化算法的约束条件,包括:
根据所述处理器的存储层级确定所述卷积神经网络中卷积层对应的循环分块层数;
根据所述网络结构参数和所述处理器参数,对所述目标优化算法设置所述循环分块层数对应的约束条件。


4.根据权利要求3所述的方法,其特征在于,所述根据所述网络结构参数和所述处理器参数,对所述目标优化算法设置所述循环分块层数对应的约束条件,包括:
根据所述卷积神经网络对应的循环分块层数,确定所述卷积神经网络对应的循环分块参数,所述循环分块参数为输入特征图、所述卷积神经网络的卷积核和输出特征图对应的分块尺寸参数;
根据所述网络结构参数和所述处理器参数,对所述目标优化算法设置所述循环分块参数对应的循环分块参数约束条件;
将所述处理器能耗约束条件和/或所述处理器性能约束条件、和所述循环分块参数约束条件确定为所述循环分块层数对应的约束条件。


5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
执行所述目标优化算法,得到满足所述处理器能耗约束条件和/或所述处理器性能约束条件、和所述循环分块参数约束条件的循环分块参数值;
执行所述目标优化算法,得到满足所述处理器能耗约束条件和/或所述处理器性能约束条件的所述数据复用方式。


6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
根据所述数据复用方式和所述循环分块参数值,调度处理器执行所述卷积神经网络对应的卷积计算。


7.根据权利要求6所述的方法,其特征在于,所述根据所述数据复用方式、所述循环分块参数值,调度处理器执行所述卷积神经网络对应的卷积计算,包括:
根据所述循环...

【专利技术属性】
技术研发人员:刘君
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1