执行卷积运算的计算装置制造方法及图纸

技术编号:39810792 阅读:17 留言:0更新日期:2023-12-22 19:27
一种计算装置

【技术实现步骤摘要】
执行卷积运算的计算装置、方法及相关产品


[0001]本披露一般地涉及数据处理领域

更具体地,本披露涉及一种计算装置

利用该计算装置执行卷积运算的方法

芯片和板卡


技术介绍

[0002]目前,深度学习
(Deep Learning)
已经成为机器学习中的重要分支,也大力助推着人工智能
(AI)
的发展

深度学习的核心技术
——
深度神经网络
(DNN)
已在诸多行业有着广泛的应用

[0003]神经网络是人工智能

深度学习中最为关键的技术之一,其中卷积神经网络
(Convolution Neural Network

CNN)
是最为重要的一种网络类型

卷积神经网络中最为关键的计算即为卷积层
(Conv layer)
的卷积运算
(Convolution Operation)。<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种计算装置,配置用于执行卷积运算,所述计算装置包括:输入存储电路,其上存储有输入特征图和卷积核,其中所述输入特征图按照输入通道
Ci
维度的拆分粒度
Pci
分段存储;多个从处理电路,用于分别对广播传输的所述输入特征图和分配给所述从处理电路的对应卷积核执行卷积运算;以及输出存储电路,用于存储所述多个从处理电路运算输出的输出特征图,其中所述输出特征图按照输出通道
Co
维度的拆分粒度
Pco
分段存储
。2.
根据权利要求1所述的计算装置,其中每个从处理电路包括第一缓冲电路

第二缓冲电路和多个运算电路,其中:所述第一缓冲电路用于缓存将要执行卷积运算的多个输入特征行,其中一个输入特征行包括输入特征图中
Pci
×
Ws

M
的数据量,
Ws
为宽度
W
维度的贡献倍数,
M
是硬件单次处理数据量;所述第二缓冲电路用于缓存将要执行卷积运算的权值数据;以及每个所述运算电路用于在每次计算时,针对分别从所述第一缓冲电路中选取的输入特征行和从所述第二缓冲电路中选取的或生成的扩展权值行执行对位乘累加运算,其中一个扩展权值行由卷积核在
Ci
维度上按照
Pci
拆分或对齐到
Pci
的一列数据块复制扩展成
Ws
列而构成
。3.
根据权利要求2所述的计算装置,其中:当所述卷积运算在
W
维度的卷积步长
Sw
为1时,一个所述输入特征行由在
W
维度连续读取的
Ws
个数据构成,每个数据的
Ci
维度大小为
Pci
;和
/
或当所述卷积运算在
W
维度的卷积步长
Sw
不为1时,一个所述输入特征行由在
W
维度上每间隔
(Sw

1)
个数据而读取的
Ws
个数据构成,每个数据的
Ci
维度大小为
Pci。4.
根据权利要求2‑3任一所述的计算装置,其中对于输出特征图中单个输出通道
Co
,每个所述从处理电路进一步用于:在每个计算周期内,利用其内可调度的
Ncu
个运算电路并行计算输出特征图上的
Ncu
个输出块,每个输出块包括在宽度
Wo
维度上连续的
Ws
个输出点,所述
Ncu
个输出块在宽度
Wo
维度和
/
或高度
Ho
维度上连续
。5.
根据权利要求4所述的计算装置,其中对于输出特征图中单个输出通道
Co
上的单个输出点,所述运算电路按如下顺序

多层循环计算所述输出点的值,其中:卷积核的
Kw
维度和
Kh
维度作为内层循环计算所述输出点的部分和,<...

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名
申请(专利权)人:中科寒武纪科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1