卷积神经网络硬件计算装置及方法制造方法及图纸

技术编号:23150329 阅读:31 留言:0更新日期:2020-01-18 13:56
本发明专利技术涉及一种卷积神经网络硬件计算装置及方法,用于实现高效的卷积计算。所述装置包括:卷积窗提取电路,用于加载输入特征图数据以及提取卷积窗;以及处理元件阵列,用于对从卷积窗提取电路接收的卷积窗与对应的权重核进行乘累加运算。卷积窗提取电路包括C个提取单元,用于并行加载和提取C个输入通道。处理元件阵列具有M行×N列个处理元件。处理元件阵列的每一列处理一个输出通道。处理元件阵列同一列的M个处理元件并行处理M个C通道K×K卷积窗。

Hardware computing device and method of convolutional neural network

【技术实现步骤摘要】
卷积神经网络硬件计算装置及方法
本专利技术涉及卷积神经网络的加速计算领域,具体涉及卷积神经网络硬件计算装置及方法。
技术介绍
人工智能技术近来得到广泛的发展和应用,各种神经网络技术的研究和应用成为技术热点。例如,在自动驾驶技术中,深度神经网络(DNN)或卷积神经网络(CNN)广泛应用于车辆、行人、交通灯检测等感知计算。卷积计算约占DNN或CNN中90%的计算复杂度,因此,设计高效的卷积计算方案成为神经网络技术的重要研究领域。
技术实现思路
本专利技术涉及一种卷积神经网络硬件计算装置及方法,用于实现高效的卷积计算。根据本专利技术的一方面,提供了一种卷积神经网络硬件计算装置,包括:卷积窗提取电路,用于加载输入特征图数据以及提取卷积窗;以及处理元件阵列,用于对从所述卷积窗提取电路接收的卷积窗与对应的权重核进行乘累加运算。其中,所述卷积窗提取电路包括C个提取单元,用于并行加载和提取C个输入通道,C≥1,每个提取单元每个时钟周期提取一个输入通道的M个K×K卷积窗以输出给所述处理元件阵列,同一时钟周期提取的M个K×K卷积窗对应所本文档来自技高网...

【技术保护点】
1.一种卷积神经网络硬件计算装置,包括:/n卷积窗提取电路,用于加载输入特征图数据以及提取卷积窗;以及/n处理元件阵列,用于对从所述卷积窗提取电路接收的卷积窗与对应的权重核进行乘累加运算,/n其中,所述卷积窗提取电路包括C个提取单元,用于并行加载和提取C个输入通道,C≥1,每个提取单元每个时钟周期提取一个输入通道的M个K×K卷积窗以输出给所述处理元件阵列,同一时钟周期提取的M个K×K卷积窗对应所述一个输入通道的输入特征图的相同K列沿列方向以纵向滑动步长S1滑动的M个K×K位置,其中M≥1,K为卷积窗尺寸,/n所述处理元件阵列具有M行×N列个处理元件,其中,N为输出通道数,/n所述处理元件阵列的...

【技术特征摘要】
1.一种卷积神经网络硬件计算装置,包括:
卷积窗提取电路,用于加载输入特征图数据以及提取卷积窗;以及
处理元件阵列,用于对从所述卷积窗提取电路接收的卷积窗与对应的权重核进行乘累加运算,
其中,所述卷积窗提取电路包括C个提取单元,用于并行加载和提取C个输入通道,C≥1,每个提取单元每个时钟周期提取一个输入通道的M个K×K卷积窗以输出给所述处理元件阵列,同一时钟周期提取的M个K×K卷积窗对应所述一个输入通道的输入特征图的相同K列沿列方向以纵向滑动步长S1滑动的M个K×K位置,其中M≥1,K为卷积窗尺寸,
所述处理元件阵列具有M行×N列个处理元件,其中,N为输出通道数,
所述处理元件阵列的每一列处理一个输出通道,以及
所述处理元件阵列同一列的M个处理元件并行处理M个C通道K×K卷积窗,每个处理元件并行处理由所述C个输入通道的各一个卷积窗组成的C个卷积窗,且每个处理元件并行处理的C个卷积窗对应所述C个输入通道的输入特征图的相同K×K大小的位置。


2.如权利要求1所述的卷积神经网络硬件计算装置,其中
所述处理元件阵列的每个处理元件包括乘加树、FIFO存储器以及加法器;
所述乘加树用于将每个时钟周期输入的C个输入通道的C个卷积窗与对应的权重核进行点乘;以及
所述FIFO存储器用于与所述加法器一起将所有输入通道的输入特征图的相同位置的点乘结果进行累加。


3.如权利要求2所述的卷积神经网络硬件计算装置,其中
所述处理元件阵列中的每个处理元件还包括定点处理单元用于定标值调整和溢出处理、激活层计算单元用于激活层计算和/或批量归一化层计算单元用于批量归一化层计算。


4.如权利要求1所述的卷积神经网络硬件计算装置,其中
所述卷积窗提取电路的每个提取单元在将当前输入通道的所有卷积窗提取完后再进行下个输入通道的卷积窗提取。


5.如权利要求1所述的卷积神经网络硬件计算装置,其中
所述卷积窗提取电路的每个提取单元在当前输入通道中与当前M个卷积窗对应的行的所有卷积窗提取完成之后,进行下个输入通道中与当前M个卷积窗对应的行的卷积窗的提取,直至所有输入通道中与当前M个卷积窗对应的行的卷积窗都被所述卷积窗提取电路提取完成,再...

【专利技术属性】
技术研发人员:陈俭金
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1