一种缓存空间动态分配的卷积神经网络硬件加速装置制造方法及图纸

技术编号：35267036 阅读：25 留言：0更新日期：2022-10-19 10:31

本发明专利技术公开了一种缓存空间动态分配的卷积神经网络硬件加速装置，包括：参数存储模块，用于缓存卷积神经网络及其每层卷积层的结构参数和空间分配参数；输入缓存模块，用于根据空间分配参数缓存卷积核的权重数据和输入特征图数据；权重数据转换模块，用于获取卷积核的权重数据并进行格式转换；特征图数据转换模块，用于获取输入特征图数据并进行格式转换；运算阵列模块，用于对格式转换后的权重数据和输入特征图数据进行乘累加运算，输出结果作为对应层的输出特征图数据；输出缓存模块，用于缓存输出特征图数据，输出特征图数据作为下一卷积层的输入特征图数据。该装置降低了计算过程的外部输入数据量，适用于各种卷积神经网络硬件加速，便于部署。便于部署。便于部署。

全部详细技术资料下载

【技术实现步骤摘要】
一种缓存空间动态分配的卷积神经网络硬件加速装置

[0001]本专利技术属于计算机
，具体涉及一种缓存空间动态分配的卷积神经网络硬件加速装置。

技术介绍

[0002]近年来，人工智能已经在众多领域得到广泛应用，给人们的生活带来很多便利。在图像处理领域，相比传统机器学习算法，深度卷积神经网络具有更高的精度，甚至超越人类的准确性。
[0003]通常卷积神经网络层数参数越多推理的结果就越准确。但与此同时，网络参数越多意味着所消耗的缓存带宽也就越多。在卷积神经网络结构中，层内计算是独立不相关的，而层间计算类似于流水线结构，使用通用处理器实现效率不高。由于卷积神经网络的特殊计算模式，尤其适合硬件加速实现。
[0004]但是卷积深度神经网络有着庞大数据量，因此如何减少卷积深度神经网络硬件加速器的外部存储访问带宽一直是人工智能领域的热门研究方向。如何在兼容各种深度神经网络算法，使用有限的硬件加速器内部缓存，保持流水、并行的简单硬件结构，降低外部数据访问量，是目前硬件加速的难点。

技术实现思路

[0005]本专利技术的目的在于针对上述问题，提出一种缓存空间动态分配的卷积神经网络硬件加速装置，降低了神经网络计算过程中整体从外部输入的数据量，大大提升硬件加速性能，并适用于各种卷积神经网络的硬件加速，便于部署。
[0006]为实现上述目的，本专利技术所采取的技术方案为：
[0007]本专利技术提出的一种缓存空间动态分配的卷积神经网络硬件加速装置，包括参数存储模块、输入缓存模块、权重数据转...

【技术保护点】

【技术特征摘要】
1.一种缓存空间动态分配的卷积神经网络硬件加速装置，其特征在于：所述缓存空间动态分配的卷积神经网络硬件加速装置包括参数存储模块、输入缓存模块、权重数据转换模块、特征图数据转换模块、运算阵列模块和输出缓存模块，其中：所述参数存储模块，用于缓存卷积神经网络及其每层卷积层的结构参数和空间分配参数K，所述空间分配参数K通过判断对应层的卷积核和输入特征图数据的大小确定；所述输入缓存模块，包括N个缓存单元，并用于根据结构参数从数据总线获取对应地址的卷积核的权重数据和输入特征图数据，然后根据空间分配参数K进行卷积核的权重数据和输入特征图数据的缓存，其中，K个缓存单元用于缓存卷积核的权重数据，N
‑
K个缓存单元用于缓存输入特征图数据；所述权重数据转换模块，用于从输入缓存模块获取卷积核的权重数据并进行格式转换；所述特征图数据转换模块，用于从输入缓存模块获取输入特征图数据并进行格式转换；所述运算阵列模块，用于对格式转换后的权重数据和输入特征图数据进行乘累加运算，输出卷积运算结果作为对应层的输出特征图数据；所述输出缓存模块，用于缓存输出特征图数据，所述输出特征图数据作为下一层的输入特征图数据。2.如权利要求1所述的缓存空间动态分配的卷积神经网络硬件加速装置，其特征在于：所述运算阵列模块按层为粒度进行卷积运算，每层卷积运算处理的数据量为：对当前卷积层大小为C*R*CN的输入特征图数据和大小为W*H*CN*G的卷积核进行卷积运算；其中，C表示输入特征图数据的宽度，R表示输入特征图数据的高度，CN表示通道数，W表示卷积核的宽，H表示卷积核的高，G表示卷积核组数。3.如权利要求1所述的缓存空间动态分配的卷积神经网络硬件加速装置，其特征在于：每个所述缓存单元为存储空间为M的随机存储...

【专利技术属性】
技术研发人员：曹学成，廖湘萍，李盈盈，丁永林，李炜，
申请(专利权)人：中国电子科技集团公司第五十二研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人