神经网络处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号:37203043 阅读:29 留言:0更新日期:2023-04-20 22:57
本申请涉及一种神经网络处理方法、装置、存储介质及电子设备,该神经网络处理方法包括:获取待处理神经网络,待处理神经网络包括待剪枝卷积核,待剪枝卷积核对应有输入特征图;确定待剪枝卷积核的目标剪枝方向;根据目标剪枝方向对待剪枝卷积核的卷积核参数进行剪枝,以得到剪枝后卷积核;根据目标剪枝方向利用剪枝后卷积核对输入特征图进行卷积运算,并在卷积运算过程中利用输出结果对输入特征图进行替换,以得到输出特征图。从而,不仅能够减少神经网络模型的参数量,还使得模型卷积运算过程中的输入和输出能够复用同一内存空间,这大大减少了模型运行过程中的计算量和对内存的访问量。存的访问量。存的访问量。

【技术实现步骤摘要】
神经网络处理方法、装置、存储介质及电子设备


[0001]本申请涉及计算机
,具体涉及一种神经网络处理方法、装置、存储介质及电子设备。

技术介绍

[0002]近年来,随着物联网(IoT)技术的发展,标志着人们的生产及生活进入了一个全面智能化的时代。物联网的基本原理是通过多种信息传感设备,按约定的协议,将任何物品与互联网相连接实现信息交换和通讯,以实现智能化识别、定位、追踪、监控和管理的一种网络技术。在此基础上,融合了人工智能技术、物联网技术、新型半导体技术以及边缘计算等高新科技的智能物联网技术(AIoT)也正蓬勃发展。
[0003]智能物联网技术主要指在小型嵌入式设备上通过采集多传感器信息,并通过嵌入式设备上的CPU、GPU或者NPU对所采集的信息经过深度神经网络的处理以完成特定的任务,如机器视觉、自动语音识别、实时翻译等。智能物联网技术目前已经被广泛应用于智能制造、自动驾驶、智能家具、安防以及智能办公等多个行业。
[0004]但是,为了提高深度学习模型的准确度,模型的参数量和计算量可能达到上亿,导致高精度模型的运行必须依赖高算力设备以及大容量内存,给在AIoT方面的落地应用带来了不小的挑战。因此,如何减少模型运行过程中的计算量和对内存的访问量,至关重要。

技术实现思路

[0005]本申请的目的在于提供一种神经网络处理方法、装置、存储介质及电子设备,以减少模型运行过程中的计算量和对内存的访问量。
[0006]本申请实施例提供了一种神经网络处理方法,该神经网络处理方法包括:<br/>[0007]获取待处理神经网络,待处理神经网络包括待剪枝卷积核,待剪枝卷积核对应有输入特征图;
[0008]确定待剪枝卷积核的目标剪枝方向;
[0009]根据目标剪枝方向对待剪枝卷积核的卷积核参数进行剪枝,以得到剪枝后卷积核;
[0010]根据目标剪枝方向利用剪枝后卷积核对输入特征图进行卷积运算,并在卷积运算过程中利用输出结果对输入特征图进行替换,以得到输出特征图。
[0011]本申请实施例还提供了一种神经网络处理装置,该神经网络处理装置包括:
[0012]获取模块,用于获取待处理神经网络,待处理神经网络包括待剪枝卷积核,待剪枝卷积核对应有输入特征图;
[0013]第一确定模块,用于确定待剪枝卷积核的目标剪枝方向;
[0014]剪枝模块,用于根据目标剪枝方向对待剪枝卷积核的卷积核参数进行剪枝,以得到剪枝后卷积核;
[0015]卷积运算模块,用于根据目标剪枝方向利用剪枝后卷积核对输入特征图进行卷积
运算,并在卷积运算过程中利用输出结果对输入特征图进行替换,以得到输出特征图。
[0016]其中,卷积运算模块具体包括:
[0017]第一确定单元,用于根据目标剪枝方向确定第一卷积顺序和第二卷积顺序;
[0018]第一卷积运算单元,用于按照第一卷积顺序和第二卷积顺序利用剪枝后卷积核逐个对输入特征图像的每个像素点进行卷积运算,并在卷积运算过程中利用每个像素点对应的输出结果对每个像素点的像素值进行替换,以得到输出特征图。
[0019]其中,卷积运算模块具体包括:
[0020]第二确定单元,用于根据目标剪枝方向确定卷积方向;
[0021]仿射变换单元,用于根据卷积方向对输入特征图进行仿射变换,得到变形输入特征图;
[0022]分块单元,用于将变形输入特征图沿横坐标方向和纵坐标方向划分为多个特征图分块;
[0023]分组单元,用于根据卷积方向将多个特征图分块分为多组;
[0024]第二卷积运算单元,用于根据卷积方向利用剪枝后卷积核逐组对每组中的各个特征图分块进行并行的卷积运算,并在并行的卷积运算过程中利用每组中的各个特征图分块对应的输出结果对每组中的各个特征图分块的像素值进行替换,以得到输出特征图。
[0025]其中,仿射变换单元具体用于:
[0026]根据卷积方向利用多面体模型中的调度算法对输入特征图的像素点坐标进行仿射变换,得到变形输入特征图的像素点变换坐标。
[0027]其中,第一确定模块包括:
[0028]第三确定单元,用于确定待剪枝卷积核的多个剪枝方向;
[0029]第四确定单元,用于从待剪枝卷积核中确定每一剪枝方向对应的多个目标卷积核参数;
[0030]求和单元,用于对每一剪枝方向对应的多个目标卷积核参数的绝对值求和,得到对应的和值;
[0031]第五确定单元,用于根据各个剪枝方向对应的和值,确定各个剪枝方向对应的抽样概率;
[0032]第六确定单元,用于根据抽样概率从多个剪枝方向中确定目标剪枝方向。
[0033]其中,剪枝模块具体用于:
[0034]将待剪枝卷积核中的除与目标剪枝方向对应的目标卷积核参数之外的其他卷积核参数置零。
[0035]其中,神经网络处理装置还包括:
[0036]第二确定模块,用于根据目标剪枝方向确定剪枝后卷积核中保留的各个卷积核参数的排序顺序;
[0037]存储模块,用于根据目标剪枝方向和排列顺序对剪枝后卷积核中保留的各个卷积核参数进行存储。
[0038]本申请实施例还提供了一种计算机可读存储介质,存储介质中存储有多条指令,指令适于由处理器加载以执行上述任一项神经网络处理方法。
[0039]本申请实施例还提供了一种电子设备,包括存储器,处理器及存储在存储器上并
可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现上述任一项神经网络处理方法中的步骤。
[0040]本申请提供的神经网络处理方法、装置、存储介质及电子设备,通过获取待处理神经网络,待处理神经网络包括待剪枝卷积核,待剪枝卷积核对应有输入特征图,然后确定待剪枝卷积核的目标剪枝方向,并根据目标剪枝方向对待剪枝卷积核的卷积核参数进行剪枝,以得到剪枝后卷积核,之后根据目标剪枝方向利用剪枝后卷积核对输入特征图进行卷积运算,并在卷积运算过程中利用输出结果对输入特征图进行替换,以得到输出特征图,从而不仅能够减少神经网络模型的参数量,还使得模型卷积运算过程中的输入和输出能够复用同一内存空间,这大大减少了模型运行过程中的计算量和对内存的访问量。
附图说明
[0041]下面结合附图,通过对本申请的具体实施方式详细描述,将使本申请的技术方案及其它有益效果显而易见。
[0042]图1是本申请实施例提供的神经网络处理系统的场景示意图;
[0043]图2是本申请实施例提供的神经网络处理方法的流程示意图;
[0044]图3是本申请实施例提供的待剪枝卷积核和目标剪枝方向的结构示意图;
[0045]图4是本申请实施例提供的待剪枝卷积核和目标剪枝方向的另一结构示意图;
[0046]图5是本申请实施例提供的待剪枝卷积核和目标剪枝方向的另一结构示意图;
[0047]图6是本申请实施例提供的待剪枝卷积核和目标剪枝方向的另一结构示意图;
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种神经网络处理方法,其特征在于,包括:获取待处理神经网络,所述待处理神经网络包括待剪枝卷积核,所述待剪枝卷积核对应有输入特征图;确定所述待剪枝卷积核的目标剪枝方向;根据所述目标剪枝方向对所述待剪枝卷积核的卷积核参数进行剪枝,以得到剪枝后卷积核;根据所述目标剪枝方向利用所述剪枝后卷积核对所述输入特征图进行卷积运算,并在卷积运算过程中利用输出结果对所述输入特征图进行替换,以得到输出特征图。2.根据权利要求1所述的神经网络处理方法,其特征在于,所述根据所述目标剪枝方向利用所述剪枝后卷积核对所述输入特征图进行卷积运算,并在卷积运算过程中利用输出结果对所述输入特征图进行替换,以得到输出特征图,具体包括:根据所述目标剪枝方向确定第一卷积顺序和第二卷积顺序;按照所述第一卷积顺序和所述第二卷积顺序利用所述剪枝后卷积核逐个对所述输入特征图像的每个像素点进行卷积运算,并在卷积运算过程中利用每个所述像素点对应的输出结果对每个所述像素点的像素值进行替换,以得到输出特征图。3.根据权利要求1所述的神经网络处理方法,其特征在于,所述根据所述目标剪枝方向利用所述剪枝后卷积核对所述输入特征图进行卷积运算,并在卷积运算过程中利用输出结果对所述输入特征图进行替换,以得到输出特征图,具体包括:根据所述目标剪枝方向确定卷积方向;根据所述卷积方向对所述输入特征图进行仿射变换,得到变形输入特征图;将所述变形输入特征图沿横坐标方向和纵坐标方向划分为多个特征图分块;根据所述卷积方向将所述多个特征图分块分为多组;根据所述卷积方向利用所述剪枝后卷积核逐组对每组中的各个所述特征图分块进行并行的卷积运算,并在并行的卷积运算过程中利用每组中的各个所述特征图分块对应的输出结果对每组中的各个所述特征图分块的像素值进行替换,以得到输出特征图。4.根据权利要求3所述的神经网络处理方法,其特征在于,所述根据所述卷积方向对所述输入特征图进行仿射变换,得到变形输入特征图,具体包括:根据所述卷积方向利用多面体模型中的调度算法对所述输入特征图的像素点坐标进行仿射变换,得到变形输入特征图的像素点变换坐标。5.根据权利要求1所...

【专利技术属性】
技术研发人员:马骥腾陈茂东陈致宏程大龙
申请(专利权)人:科大讯飞华南人工智能研究院广州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1