一种卷积运算方法及装置和卷积核拆分方法及单元制造方法及图纸

技术编号：33709289 阅读：14 留言：0更新日期：2022-06-06 08:38

本申请适用于神经网络技术领域，涉及一种卷积运算方法及装置和卷积核拆分方法及单元，卷积运算方法，应用于大小为m*m的卷积运算单元，方法包括：获取用于卷积运算的卷积核和特征数据，所述卷积核为n*n的矩阵，n大于m，n和m为大于1的整数；将所述卷积核按照卷积运算单元的大小分成N个子核，并将所述特征数据对应拆分成N个与所述子核一一对应的子矩阵，N为大于1的整数；将N个所述子矩阵中的每个所述子矩阵与一一对应的所述子核进行卷积运算，得到N个第一运算结果；将N个所述第一运算结果进行累加得到第二运算结果，所述第二运算结果为所述卷积核和所述特征数据的卷积运算结果。本申请实施例可以提升计算资源利用率，降低成本。降低成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种卷积运算方法及装置和卷积核拆分方法及单元

[0001]本申请属于神经网络
，尤其涉及一种卷积运算方法及装置和卷积核拆分方法及单元。

技术介绍

[0002]近年来，随着人工智能的不断发展，神经网络在众多领域取得了巨大成功，其应用范围也越来越广泛。
[0003]目前，神经网络架构中常用的卷积核大小一般包括1*1、3*3、5*5和7*7。为了实现这些不同的卷积核的卷积计算，神经网络处理器(Neural
‑
network Processing Unit，NPU)一般需要按照所支持的最大卷积核大小来设计计算资源，即按照7*7进行设置。
[0004]但是，神经网络架构中绝大部分计算所使用的卷积核是1*1和3*3大小，极少部分是5*5和7*7大小。为了支持7*7大小而按照7*7大小来设置计算资源的话，在大部分时间中就会有部分计算资源没有执行，导致资源的浪费，同时这部分计算资源也会导致芯片成本的增加。

技术实现思路

[0005]有鉴于此，本申请实施例提供了一种卷积运算方法及装置和卷积核拆分方法及单元，能够解决相关技术中的一个或多个技术问题。
[0006]第一方面，本申请一实施例提供了一种卷积运算方法，应用于大小为m*m的卷积运算单元，所述卷积运算方法包括：获取用于卷积运算的卷积核和特征数据，所述卷积核为n*n的矩阵，n大于m，n和m为大于1的整数；将所述卷积核按照卷积运算单元的大小拆分成N个子核，并将所述特征数据对应拆分成N个与所述子核一一对应的子矩阵，N为大于1的...

【技术保护点】

【技术特征摘要】
1.一种卷积运算方法，应用于大小为m*m的卷积运算单元，其特征在于，所述卷积运算方法包括：获取用于卷积运算的卷积核和特征数据，所述卷积核为n*n的矩阵，n大于m，n和m为大于1的整数；将所述卷积核按照所述卷积运算单元的大小拆分成N个子核，并将所述特征数据对应拆分成N个与所述子核一一对应的子矩阵，N为大于1的整数；将N个所述子矩阵中的每个所述子矩阵与一一对应的所述子核进行卷积运算，得到N个第一运算结果；将N个所述第一运算结果进行累加得到第二运算结果，所述第二运算结果为所述卷积核和所述特征数据的卷积运算结果。2.如权利要求1所述的卷积运算方法，其特征在于，所述将所述卷积核按照所述卷积运算单元的大小拆分成N个子核，包括：将所述n*n的矩阵在高度方向上拆分成N部分，得到N个大小为m*n的子核；所述将所述特征数据对应拆分成N个与所述子核一一对应的子矩阵，包括：将所述特征数据在所述高度方向上拆分成N部分以形成N个与所述子核一一对应的所述子矩阵；其中，所述特征数据在所述高度方向上包括h个数据，则所述子矩阵在所述高度方向上被配置为包括h
‑
(n
‑
m)个数据，并且基于所述复制前一个子矩阵的部分数据到后一个子矩阵中。3.如权利要求2所述的卷积运算方法，其特征在于，所述将所述n*n的矩阵在高度方向上拆分成N部分，得到N个大小为m*n的子核，包括：当n为m的N倍时，将所述n*n的矩阵在所述高度方向上以m为高度拆分成N部分，得到N个大小为m*n的子核；当n不为m的N倍时，将所述n*n的矩阵在所述高度方向上以m为高度拆分成N部分，在除第一部分外的其他部分的至少一个部分中用0数据补齐高度不足m的部分，得到N个大小为m*n的子核。4.如权利要求3所述的卷积运算方法，其特征在于，在所述至少一个部分中的属于所述n*n的矩阵的原数据行的前面或后面用0数据补齐高度不足m的部分。5.如权利要求4所述的卷积运算方法，其特征在于，当在所述至少一个部分中的属于所述n*n的矩阵的原数据行的后面用0数据补齐高度不足m的部分形成子核时，与该子核一一对应的所述子矩阵在所述高度方向上被配置为包括h

【专利技术属性】
技术研发人员：秦旋，李冰华，袁峰，
申请(专利权)人：奥比中光科技集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人