用于生成架构特定的卷积梯度核的方法和装置制造方法及图纸

技术编号:32472330 阅读:20 留言:0更新日期:2022-03-02 09:33
一种用于加速卷积运算的方法,包括从I/O接口接收第一数据集和第二数据集。将所述第一数据集变换为第一转换数据集,所述第一转换数据集具有第一格式。将所述第二数据集变换为第二转换数据集,所述第二转换数据集具有第二格式。将所述第一转换数据集和所述第二转换数据集加载到卷积功能单元中,其中,所述卷积功能单元用于接收第一格式的第一数据,接收第二格式的第二数据,以及输出第三格式的第三数据。所述任务调度器从所述卷积功能单元接收所述第三格式的结果。第三格式的结果。第三格式的结果。

【技术实现步骤摘要】
【国外来华专利技术】用于生成架构特定的卷积梯度核的方法和装置


[0001]本专利技术涉及神经网络领域,具体涉及用于确定用于训练神经网络的卷积运算符参数的方法和装置。

技术介绍

[0002]卷积神经网络(convolutional neural network,CNN)是一类常用于视觉图像分析的神经网络。在CNN中,对数据集和权重集应用卷积运算。卷积是现代神经网络中使用的最消耗资源的数学运算符之一,已经做了大量工作对其进行优化。提出了许多方案,其中许多方案使用常见的例程,例如快速傅里叶变换(Fast Fourier Transform,FFT)或图像到列(image to column,Im2Col)变换。FFT需要大量内存,因此很难在内存或内存带宽有限的系统上执行。另一方面,Im2Col例程将卷积转换为基于等效通用矩阵乘法(general matrix multiplication,GEMM)的操作。其优点在于,矩阵乘法运算应用广泛,并且通常针对选定的硬件和处理器架构进行了高度优化。
[0003]CNN接纳了数据输入集和相关权重。在使用之前,神经网络必须使本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于加速卷积运算的系统,其特征在于,所述系统包括:任务调度器;多个核,所述多个核中的每个核包括卷积功能单元,所述卷积功能单元中的每个卷积功能单元用于接收第一格式的第一数据,接收第二格式的第二数据,以及输出第三格式的第三数据;I/O接口,耦合到所述任务调度器;非瞬时性计算机可读存储介质,用于存储软件指令,所述软件指令控制所述任务调度器进行以下操作:从所述I/O接口接收第一数据集和第二数据集;将所述第一数据集变换为第一转换数据集,所述第一转换数据集具有所述第一格式;将所述第二数据集变换为第二转换数据集,所述第二转换数据集具有所述第二格式;将所述第一转换数据集和所述第二转换数据集加载到所述卷积功能单元中;从所述卷积功能单元接收所述卷积运算的所述第三格式的结果。2.根据权利要求1所述的系统,其特征在于,所述软件指令还控制所述任务调度器将所述结果变换为转换结果。3.根据权利要求2所述的系统,其特征在于,所述结果是5D格式,所述转换结果是分形格式。4.根据权利要求1至3中任一项所述的系统,其特征在于,所述第一数据集是第二卷积运算的数据集,所述第二数据集是所述数据集和权重集的所述第二卷积运算的传播误差。5.根据权利要求1至4中任一项所述的系统,其特征在于,所述第一数据是5D格式,所述第一转换数据集是5D格式,所述第二数据集是5D格式,所述第二转换数据集是分形格式。6.根据权利要求1至5中任一项所述的系统,其特征在于,所述结果是相对于所述权重集的梯度。7.根据权利要求1所述的系统,其特征在于,所述第一数据集是第二卷积运算的权重集,所述第二数据集是数据集和所述权重集的第二卷积运算的传播误差。8.根据权利要求7所述的系统,其特征在于,所述第一数据集是分形格式,所述第一转换数据集是分形格式,所述第二数据集是5D格式,所述第二转换数据是5D格式。9.根据权利要求7或8所述的系统,其特征在于,所述结果是相对于所述数据集的梯度。10.根据权利要求9所述的系统,其特征在于,所述相对于所述数据集的梯度是5D格式。11.根据权利要求1至10中任一项所述的系统,其特征在于,还包括可重定目标的数据转换器,其中,所述将所述第一数据集变换为第一转换数据集由运行所述可重定目标的数据转换器的核上的矢量或标量功能单元执行,以执行所述变换。12.根据权利要求1至11中任一项所述的系统,其特征在于,所述卷积功能单元处理三维矩阵。13.根据权利要求1至12中任一项所述的系统,其特征在于,所述卷积功能单元执行img2col函数,接着执行矩阵乘法函数。14.根据权利要求1所述的系统,其特征在于,所述第一数据集和所述第二数据集是张量格式。15.一种用于加速卷积运算的方法,其特征在于,所述方法包括:
任务调度器从I/O接口接收第一数据集和第二数据集;所述任务调度器将所述第一数据集变换为第一转换数据集,所述第一转换数据集具有第一格式;所述任务调度器将所述第二数据集变换为第二转换数据集,所述第二转换数据集具有第二格式;所述任务调度器将所述第一转换数据集和所述第二转换数据集加载到卷积功能单元中,所述卷积功能单元用于接收第一格式的第一数据,接收第二格式的第二数据,以及输出第三格式的第三数据;所述任务调度器从所述卷积功能单元接收所述卷积运算的所述第三格式的结果。16.根据权利要求15所述的方法,其特征在于,还包括:所述任务调度器将所述结果变换为转换结果。17.根据权利要求16所述的方法,其特征在于,所述结果是5D格式,所述转换结果是分形格式。18.根据权利要求15至17中任一项所述的方法,其特征在于,所述第一数据集是第二卷积运算的数据集,所述第二数据集是所述数据集和权重集的所述第二卷积运算的传播误差。19.根据权利要求15至18中任一项所述的方法,其特征在于,所述第一数据是5D格式,所述第一转换数据集是5D格式,所述第二数据集是5D格式,所述第二转换数据集是分形格式。20.根据权利要求15至19中任一项所述的方法,其特征在于,所述结果是相对于所述权重集的梯度。21.根据权利要求15所述的方法,其特征在于,所述第一数据集是第二卷积运算的权重集,所述第二数据集是数据...

【专利技术属性】
技术研发人员:
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1