计算装置、利用计算装置实施卷积运算的方法及相关产品制造方法及图纸

技术编号:37100256 阅读:21 留言:0更新日期:2023-04-01 05:01
本披露公开了一种计算装置、利用计算装置实施卷积运算的方法及相关产品。该计算装置可以包括在组合处理装置中,该组合处理装置还可以包括接口装置和其他处理装置。该计算装置与其他处理装置进行交互,共同完成用户指定的计算操作。组合处理装置还可以包括存储装置,该存储装置分别与计算装置和其他处理装置连接,用于存储该计算装置和其他处理装置的数据。本披露的方案对卷积运算进行优化,提高了运算处理效率。理效率。理效率。

【技术实现步骤摘要】
计算装置、利用计算装置实施卷积运算的方法及相关产品


[0001]本披露一般地涉及数据处理领域。更具体地,本披露涉及一种配置用于执行卷积运算的计算装置、利用计算装置实施卷积运算的方法、芯片和板卡。

技术介绍

[0002]目前,深度学习(Deep Learning)已经成为机器学习中的重要分支,也大力助推着人工智能(AI)的发展。深度学习的核心技术——深度神经网络(DNN)已在诸多行业有着广泛的应用。
[0003]神经网络是人工智能、深度学习中最为关键的技术之一,其中卷积神经网络(Convolution Neural Network,CNN)是最为重要的一种网络类型。卷积神经网络中最为关键的计算即为卷积层(Conv layer)的卷积运算(Convolution Operation)。卷积层的功能是对输入数据进行特征提取,通过多层卷积,能够抽取复杂特征,以保证网络具有足够的表达能力和泛化能力。神经网络模型中包含了大量的、各种类型的卷积运算,卷积运算的计算性能极大地影响整个神经网络模型的计算性能。当神经网络模型应用于不同领域时,例如语音识别、本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种计算装置,配置用于执行卷积运算,所述计算装置包括:主处理电路,所述主处理电路用于:获取输入特征图和/或卷积核,其中所述输入特征图和卷积核已分别按卷积拆分方案拆分成多个拆分单元并转换维度存储顺序,其中一个拆分单元包括最低存储维度和至少一个其他存储维度的数据,并且一个拆分单元的数据量不超过硬件单次最大运算量,单轮运算中卷积核的输出通道Co维度的尺寸不超过所述从处理电路的数量,并且一个拆分单元内的数据连续存储为一个数据行;以及多个从处理电路,所述多个从处理电路用于对所述输入特征图和卷积核的对应数据行执行卷积运算。2.根据权利要求1所述的计算装置,其中所述卷积拆分方案还指示执行所述卷积运算的运算轮次、各轮次运算中处理的Co数量及相应的分组模式。3.根据权利要求2所述的计算装置,其中所述分组模式为GroupN,表示当前轮次运算中执行运算的Ns个从处理电路分为N组,每个从处理电路组处理同一Co值,不同从处理电路组处理不同Co值,N=4
n
,n=0,1,2

。4.根据权利要求3所述的计算装置,其中每个从处理电路组包括Rs个从处理电路,并且所述主处理电路进一步用于在所述Rs个从处理电路之间按如下划分所述输入特征图:根据对应的输出特征图的尺寸,将所述输出特征图在HW维度上平均划分为Rs个形状相同的输出特征块;以及根据计算每个输出特征块所需的输入特征图区域,将所述输入特征图在HW维度上划分为Rs个输入特征块,以分配给所述Rs个从处理电路。5.根据权利要求4所述的计算装置,其中所述计算装置还包括第一存储电路和第二存储电路,所述卷积核确定为多播数据,拆分并转换维度存储顺序后的多播数据存储在第一存储电路中,以在运算期间通过广播总线传输给所调度的多个从处理电路;以及所述输入特征图确定为分发数据,拆分并转换维度存储顺序后的分发数据存储在第二存储电路中,以便分发给对应的从处理电路。6.根据权利要求5所述的计算装置,其中所述Rs个输入特征块分别按所述拆分单元进行拆分并转换维度存储顺序后存储在所述第二存储电路中为所述Rs个从处理电路分配的存储区域中。7.根据权利要求5

6任一所述的计算装置,其中每个所述从处理电路包括第一缓冲电路、第二缓冲电路和多个运算电路,其中:所述第一缓冲电路用于缓存来自所述第二存储电路的、分发给所述从处理电路的多个输入特征数据行;所述第二缓冲电路用于缓存来自所述第一存储电路的、多播传输给所述从处理电路的对应输出通道值的卷积核的多个权值数据行;并且每个运算电路用于在每次运算中,针对分别从所述第一缓冲电路中选取的输入特征数据行和从所述第二缓冲电路中选取的权值数据行执行对位乘累加运算。8.根据权利要求7所述的计算装置,其中所述从处理电路进一步用于按如下在其可调度的N
CU
个运算电路之间划分输出点:每次计算时,每个运算电路计算所述输出特征图上在X和/或Y维度间隔的多个输出点。
9.根据权利要求8所述的计算装置,其中所述卷积运算为三维卷积运算,并且每个所述从处理电路进一步用于:按...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:中科寒武纪科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1