一种卷积神经网络加速器制造技术

技术编号：24290135 阅读：47 留言：0更新日期：2020-05-26 20:16

本发明专利技术公开了一种卷积神经网络加速器，包括卷积模块、激活模块、池化模块、结果处理模块和控制模块；各个所述模块之间通过异步握手的方式完成数据通信的同步化；其中，所述卷积模块采用两级脉动阵列运算架构，能够实现加速器内权重数据及特征数据的复用，提高加速器在边界处的卷积计算单元(PE)利用率；卷积计算单元内部的乘法器引入七级流水线乘法器，能够提高加速器的计算并行度；使用异步握手信号取代全局时钟信号，能够从根源上消除时钟网络的功耗，从而降低系统的总功耗，提高加速器的能效比，而且由于没有时钟信号，不需要进行时序分析，系统具有更好的可扩展性。本发明专利技术广泛应用于电子信息与深度学习领域。

A convolutional neural network accelerator

全部详细技术资料下载

【技术实现步骤摘要】
一种卷积神经网络加速器
本专利技术涉及电子信息与深度学习领域，尤其是一种卷积神经网络加速器。
技术介绍
近年来，卷积神经网络(CNN)引起了广泛的关注，推动着人工智能领域的高速发展，并取得巨大成功，其中以AlphaGo/AlphaZero为典型代表。如今，以CNN为基础的深度学习吸引了来自工业界和学术界的目光，在多个领域得到应用，包括图像检测、目标识别和自然语言处理等。神经网络具有巨大的计算量和访存次数，传统的通用处理器面对如此巨大的运算显得捉襟见肘。一种针对CNN的专用处理器—CNN加速器应运而生。业界和学术界不断提出新的架构，以期得到具有高能效比的CNN加速器。然而目前的CNN加速器设计都是基于同步方法学的，时钟信号是不可缺少的。随着电路规模的增大，系统本身的时钟网络也将变得更加复杂。加速器在时钟网络所消耗的功耗急剧上升，已有加速器时钟网络功耗的占比甚至达到了40％以上，导致加速器本身的能效降低。
技术实现思路
为了解决至少一个上述技术问题，本专利技术的目的在于提供一种卷积神经网络加速器。本专利技术所采取的技术方案是：本专利技术实施例包括一种卷积神经网络加速器，包括卷积模块、激活模块、池化模块、结果处理模块、控制模块和片内存储器；各个所述模块之间通过异步握手的方式完成数据通信的同步化；所述卷积模块包括卷积计算单元，所述卷积模块用于读取片内存储器的权重数据和特征数据，并进行卷积计算，所述权重数据和特征数据以两级脉动的方式在所述卷积计算单元之间流动；所述激活模块用于...

【技术保护点】
1.一种卷积神经网络加速器，其特征在于，包括卷积模块、激活模块、池化模块、结果处理模块、控制模块和片内存储器；各个所述模块之间通过异步握手的方式完成数据通信的同步化；/n所述卷积模块包括卷积计算单元，所述卷积模块用于读取片内存储器的权重数据和特征数据，并进行卷积计算，所述权重数据和特征数据以两级脉动的方式在所述卷积计算单元之间流动；/n所述激活模块用于对所述卷积模块的卷积计算结果进行非线性处理，结果送入所述池化模块；/n所述池化模块用于对所述激活模块的处理结果进行池化处理；/n所述结果处理模块，用于根据控制信号将所述激活模块处理后的结果和/或所述池化模块处理后的结果送到片内存储器进行缓存；/n所述控制模块，用于控制各个所述模块的工作。/n

【技术特征摘要】
1.一种卷积神经网络加速器，其特征在于，包括卷积模块、激活模块、池化模块、结果处理模块、控制模块和片内存储器；各个所述模块之间通过异步握手的方式完成数据通信的同步化；
所述卷积模块包括卷积计算单元，所述卷积模块用于读取片内存储器的权重数据和特征数据，并进行卷积计算，所述权重数据和特征数据以两级脉动的方式在所述卷积计算单元之间流动；
所述激活模块用于对所述卷积模块的卷积计算结果进行非线性处理，结果送入所述池化模块；
所述池化模块用于对所述激活模块的处理结果进行池化处理；
所述结果处理模块，用于根据控制信号将所述激活模块处理后的结果和/或所述池化模块处理后的结果送到片内存储器进行缓存；
所述控制模块，用于控制各个所述模块的工作。

2.根据权利要求1所述的一种卷积神经网络加速器，其特征在于，所述卷积模块包含至少一个卷积层，每个所述卷积层是由多个卷积计算单元组成的卷积运算阵列，所有卷积计算单元完成一轮卷积计算后，所述卷积模块的各个卷积层以列为单位将卷积计算的结果送到所述激活模块和所述池化模块依次处理。

3.根据权利要求2所述的一种卷积神经网络加速器，其特征在于，所述卷积模块中的每一个卷积层对应一个激活模块中的激活层和一个池化模块中的池化层；所述卷积层的计算结果将被送到对应同一层的所述激活层和所述池化层和依次处理。

4.根据权利要求2所述的一种卷积神经网络加速器，其特征在于，所述卷积层的计算结果经激活模块进行非线性处理后，送入所述池化模块进行池化处理，所述结果处理模块根据控制信号将所述池化模块处理后的结果送到片内存储器进行缓存；当检...

【专利技术属性】
技术研发人员：刘伟坤，林俊树，李旭胜，肖山林，虞志益，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人