一种面向卷积神经网络的低功耗电压可调卷积运算模块制造技术

技术编号：16345963 阅读：67 留言：0更新日期：2017-10-03 22:20

本发明专利技术公开了一种面向卷积神经网络的低功耗电压可调卷积运算模块，包括数据传输单元、电压可调缓存单元、卷积运算模块三部分。对于卷积神经网络，卷积运算占据整体运算量的一半以上，而卷积计算时图像数据矩阵中数据会被同一卷积核读取多次，且存在多个卷积核对这些数据进行同时访问的情况，使数据重用频次进一步提高。由于数据矩阵中的数据重用频次存在较大差异，将重用频次相同或相近的数据存放在一起，根据缓存中数据重用频次的分布调节存储模块电压，可以降低卷积神经网络加速器的整体功耗。本发明专利技术提出的低功耗电压可调卷积运算模块可以根据不同重用次数，进行不同缓存区域的电压调节，用以完成不同规模及步长情况下的卷积运算。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向卷积神经网络的低功耗电压可调卷积运算模块
本专利技术涉及一种面向卷积神经网络的低功耗电压可调卷积运算模块，利用卷积运算中存在数据大量重用的规律，实现卷积神经网络进行大数量循环卷积运算，对数据进行重用。在卷积网络的一层卷积运算中，根据数据重用频度比例，在缓存中的不同存储片区中选取不同电压，降低功耗。属于神经网络硬件加速器

技术介绍
卷积运算在图像处理领域有着广泛的用途，例如在图像滤波、图像增强、图像分析等处理时都要用到卷积运算，图像卷积运算实质是一种矩阵运算，其特点是运算量大，并且数据复用率高，用软件计算图像卷积很难达到实时性的要求。卷积神经网络作为一种前馈多层神经网络，能够对大量有标签数据进行自动学习并从中提取复杂特征，卷积神经网络的优点在于只需要对输入图像进行较少的预处理就能够从像素图像中识别出视觉模式，并且对有较多变化的识别对象也有较好的识别效果，同时卷积神经网络的识别能力不易受到图像的畸变或简单几何变换的影响。作为多层人工神经网络研究的一个重要方向，卷积神经网络多年来一直是研究的热点。传统方式卷积运算的缓存是直接从外部存储读取，由于受到数据读取带宽的限制，以及没有可配置阵列，完成多层卷积循环运算，效率较低。如果能把进入缓存中的一块数据完全利用，不用根据轨迹的变化，不断从外存中读取，将降低吞吐要求，并且解决了不同重用次数数据之间存在读取时间等待的问题，即不同缓存区域数据可以对应不同读取主频这里选用不同电压的缓存，那些重用次数低，对读取主频要求的数据可以在低电压缓存区域，根据低重用次数数据的占比，可以动态调节电压，降低功耗。对于典型卷积...
一种面向卷积神经网络的低功耗电压可调卷积运算模块

【技术保护点】
一种面向卷积神经网络的低功耗电压可调卷积运算模块，其特征在于：包括数据传输单元、电压可调缓存单元和卷积计算单元；所述数据传输单元，用于传输图像数据进入电压可调缓存单元；电压可调缓存单元用以根据数据重用频度，将数据分布于不同电压的存储片区；卷积计算单元卷将存储片区的数据进行卷积运算，输出运算结果；所述数据传输单元，将计算数据根据此次卷积运算的卷积核及图片的规模大小，获得图像数据重用分布，切割合适宽度数据块转换为一维数据进入电压可调缓存单元；在电压可调缓存单元，根据进入电压可调缓存单元的一维数据的重用次数累加和，与达到此累加和的先后顺序，仲裁在缓存单元中不同存储片区的排布，按重用频度从高到低的排布，选取高重用频度数据进入高电压缓存区域，低重用频度数据进入低电压缓存区域，根据频度重用数据占比来调节存储片区电压；在卷积计算单元中，使多个卷积核同时对缓存中一个片区的数据进行卷积，这里并行实现，且在电压可调缓存单元中缓存的图像数据需要根据卷积运算的原有轨迹，完成原有轨迹一次卷积运算的相加运算，这里采用Crossbar结构，完成卷积运算的输出。

【技术特征摘要】
1.一种面向卷积神经网络的低功耗电压可调卷积运算模块，其特征在于：包括数据传输单元、电压可调缓存单元和卷积计算单元；所述数据传输单元，用于传输图像数据进入电压可调缓存单元；电压可调缓存单元用以根据数据重用频度，将数据分布于不同电压的存储片区；卷积计算单元卷将存储片区的数据进行卷积运算，输出运算结果；所述数据传输单元，将计算数据根据此次卷积运算的卷积核及图片的规模大小，获得图像数据重用分布，切割合适宽度数据块转换为一维数据进入电压可调缓存单元；在电压可调缓存单元，根据进入电压可调缓存单元的一维数据的重用次数累加和，与达到此累加和的先后顺序，仲裁在缓存单元中不同存储片区的排布，按重用频度从高到低的排布，选取高重用频度数据进入高电压缓存区域，低重用频度数据进入低电压缓存区域，根据频度重用数据占比来调节存储片区电压；在卷积计算单元中，使多个卷积核同时对缓存中一个片区的数据进行卷积，这里并行实现，且在电压可调缓存单元中缓存的图像数据需要根据卷积运算的原有轨迹，完成原有轨迹一次卷积运算的相加运算，这里采用Crossbar结构，完成卷积运算的输出。2.根据权利要求1所述的一种面向卷积神经网络的低功耗电压可调卷积运算模块，其特征在于：所述数据传输单元包括数据仲裁模块、数据读取模块；所述数据仲裁模块根据此层数据卷积运算卷积核和图像数据的规模大小，对应数据的重用频度分布，判定选取二维图像数据的拼接区域大小；当图像数据和卷积核的规模确定时，整个图像数据的重用频度分布在卷积运算算法的基础上已经确定，在电压可调缓存单元，不同数据读取频度存放在不同存储片区上，以降低功耗开销；所述数据读取模块，根据切割图片大小，将此区域数据多行拼接为一行，进入电压可调缓存单元。3.根据权利要求1或2所述的一种面向卷积神经网络的低功耗电压可调卷积运算模块，其特征在于：所述电压可调缓存单元，包括重用频度判断模块、...

【专利技术属性】
技术研发人员：龚宇，刘波，朱智洋，徐亭亭，杨军，时龙兴，
申请(专利权)人：东南大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人