数据卷积处理方法、装置及计算机设备制造方法及图纸

技术编号:30327212 阅读:38 留言:0更新日期:2021-10-10 00:13
本申请实施例提供了一种数据卷积处理方法、装置及计算机设备,其中方法包括:获取多个特征图数据及多个权重数据;将多个特征图数据及多个权重数据划分为多份分组数据;将各分组数据输入硬件加速器对应的一个乘加单元;控制乘加单元对分组数据的特征图数据进行预处理,得到用于执行卷积操作的待卷积数据;控制乘加单元跳过待卷积数据的零值点及分组数据的权重数据的零值点,对待卷积数据的非零值点及分组数据的权重数据的非零值点执行卷积运算。这样,可以在卷积处理过程中去掉含零值的乘法运算,减少计算数量,加快运算速度,提高性能。提高性能。提高性能。

【技术实现步骤摘要】
数据卷积处理方法、装置及计算机设备


[0001]本申请涉及人工智能领域,尤其涉及一种数据卷积处理方法、装置及计算机设备。

技术介绍

[0002]随着人工智能技术飞速发展,推出各种神经网络模型,神经网络模型需要的算力也是日益提升。为满足神经网络模型的计算需求,产生了各种硬件加速器,硬件加速器是指通过特定处理的专用硬件,利用电路的并行性以及高速处理来加快各种神经网络模型的运行。现有神经网络模型存在有大量卷积运算,如何提高卷积运算的处理速度成为亟需解决的问题。

技术实现思路

[0003]为了解决上述技术问题,本申请实施例提供了一种数据卷积处理方法、装置及计算机设备。
[0004]第一方面,本申请实施例提供了一种数据卷积处理方法,所述方法包括:
[0005]获取多个特征图数据及多个权重数据;
[0006]将所述多个特征图数据及所述多个权重数据划分为多份分组数据,所述分组数据包括一个特征图数据及对应的一个权重数据;
[0007]将各分组数据输入硬件加速器对应的一个乘加单元;
[0008]控制所述乘加单元对所述分组数据的特征图数据进行预处理,得到用于执行卷积操作的待卷积数据;
[0009]控制所述乘加单元跳过所述待卷积数据的零值点及所述分组数据的权重数据的零值点,对所述待卷积数据的非零值点及所述分组数据的所述权重数据的非零值点执行卷积运算。
[0010]可选的,所述控制所述乘加单元跳过所述待卷积数据的零值点及所述分组数据的权重数据的零值点,对所述待卷积数据的非零值点及所述分组数据的所述权重数据的非零值点执行卷积运算,包括:
[0011]获取第一零值点统计信息及第二零值点统计信息,所述第一零值点统计信息的各数据位设置有所述待卷积数据的各数值点是否为零的标志,所述第二零值点统计信息的各数据位设置有所述分组数据的所述权重数据的各数值点是否为零的标志;
[0012]控制所述乘加单元根据所述第一零值点统计信息及所述第二零值点统计信息的数据位对应的标志获取所述待卷积数据的非零值点及所述权重数据的非零值点;
[0013]控制所述乘加单元对获取到的所述待卷积数据的非零值点及所述权重数据的非零值点进行卷积运算。
[0014]可选的,所述标志包括表示零值点的第一标志、及表示非零值点的第二标志,所述控制所述乘加单元根据所述第一零值点统计信息及所述第二零值点统计信息的数据位对应的标志获取所述待卷积数据的非零值点及所述权重数据的非零值点,包括:
[0015]控制所述乘加单元按照所述第一零值点统计信息及所述第二零值点统计信息的数据位排序遍历各数据位的标志,在所述第一零值点统计信息及所述第二零值点统计信息的数据位排序相同的当前数据位上遍历到至少一个所述第一标志时,跳过所述当前数据位对应的所述待卷积数据的数值点及所述权重数据的数值点;
[0016]在所述第一零值点统计信息及所述第二零值点统计信息的数据位排序相同的当前数据位上均遍历到所述第二标志时,获取所述当前数据位对应的所述待卷积数据的非零值点及所述权重数据的非零值点。
[0017]可选的,所述获取多个特征图数据及多个权重数据,包括:
[0018]确定所述硬件加速器的乘加单元数量;
[0019]根据所述乘加单元数量确定所述多个特征图数据及所述多个权重数据,其中,各特征图数据为特征图矩阵数据,各权重数据为权重矩阵数据,分组数据的数量与所述硬件加速器的乘加单元数量相同。
[0020]可选的,所述待卷积数据为待卷积矩阵数据,所述控制所述乘加单元对所述分组数据的特征图数据进行预处理,得到用于执行卷积操作的待卷积数据,包括:
[0021]控制所述乘加单元遍历所述特征图矩阵数据的数值点,为遍历到的当前数值点构建与所述权重矩阵数据的行列数相同的待卷积矩阵数据。
[0022]可选的,所述为遍历到的当前数值点构建与所述权重矩阵数据的行列数相同的待卷积矩阵数据,包括:
[0023]若将所述当前数值点作为矩阵中心,能在所述特征图矩阵数据截取与所述权重矩阵数据的行列数相同的完整矩阵时,则将截取到的完整矩阵作为所述待卷积矩阵数据;
[0024]若将所述当前数值点作为矩阵中心,不能在所述特征图矩阵数据截取与所述权重矩阵数据的行列数相同的完整矩阵时,则将截取到的残缺矩阵补充完整,得到所述待卷积矩阵数据。
[0025]可选的,所述获取多个特征图数据及多个权重数据,包括:
[0026]根据输入的图像获取所述多个特征图数据;
[0027]从卷积层的输出通道获取所述多个权重数据。
[0028]第二方面,本申请实施例提供了一种数据卷积处理装置,所述数据卷积处理装置包括:
[0029]获取模块,用于获取多个特征图数据及多个权重数据;
[0030]划分模块,用于将所述多个特征图数据及所述多个权重数据划分为多份分组数据,所述分组数据包括一个特征图数据及对应的一个权重数据;
[0031]输入模块,用于将各分组数据输入硬件加速器对应的一个乘加单元;
[0032]预处理模块,用于控制所述乘加单元对所述分组数据的特征图数据进行预处理,得到用于执行卷积操作的待卷积数据;
[0033]控制模块,用于控制所述乘加单元跳过所述待卷积数据的零值点及所述分组数据的权重数据的零值点,对所述待卷积数据的非零值点及所述分组数据的所述权重数据的非零值点执行卷积运算。
[0034]可选的,控制模块,还用于获取第一零值点统计信息及第二零值点统计信息,所述第一零值点统计信息的各数据位设置有所述待卷积数据的各数值点是否为零的标志,所述
第二零值点统计信息的各数据位设置有所述分组数据的所述权重数据的各数值点是否为零的标志;
[0035]控制所述乘加单元根据所述第一零值点统计信息及所述第二零值点统计信息的数据位对应的标志获取所述待卷积数据的非零值点及所述权重数据的非零值点;
[0036]控制所述乘加单元对获取到的所述待卷积数据的非零值点及所述权重数据的非零值点进行卷积运算。
[0037]可选的,所述标志包括表示零值点的第一标志、及表示非零值点的第二标志,控制模块,还用于控制所述乘加单元按照所述第一零值点统计信息及所述第二零值点统计信息的数据位排序遍历各数据位的标志,在所述第一零值点统计信息及所述第二零值点统计信息的数据位排序相同的当前数据位上遍历到至少一个所述第一标志时,跳过所述当前数据位对应的所述待卷积数据的数值点及所述权重数据的数值点;
[0038]在所述第一零值点统计信息及所述第二零值点统计信息的数据位排序相同的当前数据位上均遍历到所述第二标志时,获取所述当前数据位对应的所述待卷积数据的非零值点及所述权重数据的非零值点。
[0039]可选的,获取模块,用于确定所述硬件加速器的乘加单元数量;
[0040]根据所述乘加单元数量确定所述多个特征图数据及所述多个权重数据,其中,各特征图数据为特征图矩阵数据,各权重本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据卷积处理方法,其特征在于,所述方法包括:获取多个特征图数据及多个权重数据;将所述多个特征图数据及所述多个权重数据划分为多份分组数据,所述分组数据包括一个特征图数据及对应的一个权重数据;将各分组数据输入硬件加速器对应的一个乘加单元;控制所述乘加单元对所述分组数据的特征图数据进行预处理,得到用于执行卷积操作的待卷积数据;控制所述乘加单元跳过所述待卷积数据的零值点及所述分组数据的权重数据的零值点,对所述待卷积数据的非零值点及所述分组数据的所述权重数据的非零值点执行卷积运算。2.根据权利要求1所述的方法,其特征在于,所述控制所述乘加单元跳过所述待卷积数据的零值点及所述分组数据的权重数据的零值点,对所述待卷积数据的非零值点及所述分组数据的所述权重数据的非零值点执行卷积运算,包括:获取第一零值点统计信息及第二零值点统计信息,所述第一零值点统计信息的各数据位设置有所述待卷积数据的各数值点是否为零的标志,所述第二零值点统计信息的各数据位设置有所述分组数据的所述权重数据的各数值点是否为零的标志;控制所述乘加单元根据所述第一零值点统计信息及所述第二零值点统计信息的数据位对应的标志获取所述待卷积数据的非零值点及所述权重数据的非零值点;控制所述乘加单元对获取到的所述待卷积数据的非零值点及所述权重数据的非零值点进行卷积运算。3.根据权利要求2所述的方法,其特征在于,所述标志包括表示零值点的第一标志、及表示非零值点的第二标志,所述控制所述乘加单元根据所述第一零值点统计信息及所述第二零值点统计信息的数据位对应的标志获取所述待卷积数据的非零值点及所述权重数据的非零值点,包括:控制所述乘加单元按照所述第一零值点统计信息及所述第二零值点统计信息的数据位排序遍历各数据位的标志,在所述第一零值点统计信息及所述第二零值点统计信息的数据位排序相同的当前数据位上遍历到至少一个所述第一标志时,跳过所述当前数据位对应的所述待卷积数据的数值点及所述权重数据的数值点;在所述第一零值点统计信息及所述第二零值点统计信息的数据位排序相同的当前数据位上均遍历到所述第二标志时,获取所述当前数据位对应的所述待卷积数据的非零值点及所述权重数据的非零值点。4.根据权利要求1所述的方法,其特征在于,所述获取多个特征图数据及多个权重数据,包括:确定所述硬件加速器的乘加单元数量...

【专利技术属性】
技术研发人员:胡云鹏王洪胡华斌曾纪国阳昭衡
申请(专利权)人:湖南国科微电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1