当前位置: 首页 > 专利查询>东南大学专利>正文

一种面向卷积神经网络的低功耗电压可调卷积运算模块制造技术

技术编号:16345963 阅读:67 留言:0更新日期:2017-10-03 22:20
本发明专利技术公开了一种面向卷积神经网络的低功耗电压可调卷积运算模块,包括数据传输单元、电压可调缓存单元、卷积运算模块三部分。对于卷积神经网络,卷积运算占据整体运算量的一半以上,而卷积计算时图像数据矩阵中数据会被同一卷积核读取多次,且存在多个卷积核对这些数据进行同时访问的情况,使数据重用频次进一步提高。由于数据矩阵中的数据重用频次存在较大差异,将重用频次相同或相近的数据存放在一起,根据缓存中数据重用频次的分布调节存储模块电压,可以降低卷积神经网络加速器的整体功耗。本发明专利技术提出的低功耗电压可调卷积运算模块可以根据不同重用次数,进行不同缓存区域的电压调节,用以完成不同规模及步长情况下的卷积运算。

【技术实现步骤摘要】
一种面向卷积神经网络的低功耗电压可调卷积运算模块
本专利技术涉及一种面向卷积神经网络的低功耗电压可调卷积运算模块,利用卷积运算中存在数据大量重用的规律,实现卷积神经网络进行大数量循环卷积运算,对数据进行重用。在卷积网络的一层卷积运算中,根据数据重用频度比例,在缓存中的不同存储片区中选取不同电压,降低功耗。属于神经网络硬件加速器

技术介绍
卷积运算在图像处理领域有着广泛的用途,例如在图像滤波、图像增强、图像分析等处理时都要用到卷积运算,图像卷积运算实质是一种矩阵运算,其特点是运算量大,并且数据复用率高,用软件计算图像卷积很难达到实时性的要求。卷积神经网络作为一种前馈多层神经网络,能够对大量有标签数据进行自动学习并从中提取复杂特征,卷积神经网络的优点在于只需要对输入图像进行较少的预处理就能够从像素图像中识别出视觉模式,并且对有较多变化的识别对象也有较好的识别效果,同时卷积神经网络的识别能力不易受到图像的畸变或简单几何变换的影响。作为多层人工神经网络研究的一个重要方向,卷积神经网络多年来一直是研究的热点。传统方式卷积运算的缓存是直接从外部存储读取,由于受到数据读取带宽的限制,以及没有可配置阵列,完成多层卷积循环运算,效率较低。如果能把进入缓存中的一块数据完全利用,不用根据轨迹的变化,不断从外存中读取,将降低吞吐要求,并且解决了不同重用次数数据之间存在读取时间等待的问题,即不同缓存区域数据可以对应不同读取主频这里选用不同电压的缓存,那些重用次数低,对读取主频要求的数据可以在低电压缓存区域,根据低重用次数数据的占比,可以动态调节电压,降低功耗。对于典型卷积神经网络,其卷积计算量占据整体计算的主要部分,而卷积计算时,图像数据矩阵中许多数据会被同一卷积核重用多次,而且存在多个卷积核,这样就会存在更多数据重用。卷积网络卷积运动是十分有规律的,如果具体到每个数据的重用次数,根据读取频度做存储分配,不同缓存对应不同电压,不同于原有电压不考虑读取次数多少的问题,功耗会大为降低。目前便携式设备最主要的问题就是功耗,而本专利技术的出发点就是通过重用次数分析,数据在不同电压缓存中分布,降低功耗。
技术实现思路
专利技术目的:针对现有技术中存在的卷积计算中吞吐量低等问题,本专利技术提供一种面向卷积神经网络的低功耗电压可调卷积运算模块,可以加速完成大数量卷积计算的要求,对数据进入缓存是规整读取数据块再转换为一维数据,降低对宽带的压力。根据输入图像数据重用结构,利用循环卷积运算中的高重用率特性,对应不同重用次数在数据中的占比,可以调节电压,平衡不同重用次数间的读取速率,达到降低功耗的目的,并且卷积运算的卷积核及图片规模变化都适用于此方法。技术方案:一种面向卷积神经网络的低功耗电压可调卷积运算模块,包括数据传输单元、电压可调缓存单元、卷积计算单元三部分。所述数据传输单元,将计算数据根据此次卷积运算的卷积核及图片的规模大小,获得图像数据重用分布,切割数据块与卷积核大小一致,并转换为一维数据进入电压可调缓存单元。在电压可调缓存单元,根据进入电压可调缓存单元的一维数据的重用次数累加和,与达到此累加和的先后顺序,仲裁在缓存单元中不同存储片区的排布,按重用频度从高到低的排布,选取高重用频度数据(重用6次及以上)进入高电压缓存区域,低重用频度数据(重用5次及以下)进入低电压缓存区域,根据重用频度将数据存储至相应电压的缓存区域。分好区域后,存储片区数据读取的快慢要求较大,即主频差异较大,最高读取次数和最低读取次数相差数倍,如果依照重用频度分块,使不同区域电压实现可调,高重用次数处,电压较高,低重用次数处电压变低,这样模块的功耗大大降低。针对低主频卷积计算,可通过降低电源电压的方式来有效的降低功耗(正比于电压平方次)。当重用次数较高时,这时系统可以让处理器工作在常规电源电压,实现电压可调可以使能效比大为提高。在卷积计算单元中,使多个卷积核同时对缓存中一个片区的图像数据进行卷积,这里并行实现,且在电压可调缓存单元中缓存的图像数据需要根据卷积运算的原有轨迹,完成原有轨迹一次卷积运算的相加运算,这里采用Crossbar结构,完成卷积运算的输出。卷积计算中相乘运算完成后,每个值和多个权重值相乘,会得到多个结果,根据轨迹进入临时寄存器,待选取部分相乘完成,就会把一次卷积轨迹填满,这里是并行化完成的,最终相加得到终值。卷积相乘结果存进来只用一次,卷积计算单元内部相加单元对应临时寄存器选取crossbar结构,临时数据寄存器单元TDR与计算单元的互连,临时数据寄存器之间的互连,临时数据寄存器阵列中每一行的任意一个临时数据寄存器,其输入数据可以来自其上一行的任意一个临时数据寄存器,并且最顶行临时寄存器的输入,连接到最底行临时寄存器的数据输出端,从而整个临时数据寄存器阵列构成了一个单向循环互连的拓扑结构。有益效果:与现有技术相比,本专利技术提供的面向卷积神经网络的低功耗电压可调卷积运算模块,可以大幅提高卷积计算中的访存速度,减少访存开销,提升卷积计算的速度和效率。附图说明图1为图像数据为9×9,卷积核为3×3的数据分类示意图;图2为卷积计算中数据为偶矩阵时重用次数分布图;图3为卷积计算中数据为奇矩阵时重用次数分布图;图4为基于宽电压SRAM的低功耗卷积神经网络卷积运算设计整体框图;图5为基于宽电压SRAM的低功耗卷积神经网络卷积运算设计流程图。具体实施方式下面结合具体实施例,进一步阐明本专利技术,应理解这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围,在阅读了本专利技术之后,本领域技术人员对本专利技术的各种等价形式的修改均落于本申请所附权利要求所限定的范围。面向卷积神经网络的低功耗电压可调卷积运算模块,包括数据传输单元、电压可调缓存单元、卷积计算单元三部分。数据传输单元,用于传输图像数据进入电压可调缓存单元;电压可调缓存单元用以根据数据重用频度,将数据分布于不同电压的存储片区;卷积计算单元卷将存储片区的数据进行卷积运算,输出运算结果;数据传输单元,将计算数据根据此次卷积运算的卷积核及图片的规模大小,获得图像数据重用分布,切割合适宽度数据块转换为一维数据进入电压可调缓存单元;在电压可调缓存单元,根据进入电压可调缓存单元的一维数据的重用次数累加和,与达到此累加和的先后顺序,仲裁在缓存单元中不同存储片区的排布,按重用频度从高到低的排布,选取高重用频度数据进入高电压缓存区域,低重用频度数据进入低电压缓存区域,根据频度重用数据占比来调节存储片区电压;在卷积计算单元中,使多个卷积核同时对缓存中一个片区的数据进行卷积,这里并行实现,且在电压可调缓存单元中缓存的图像数据需要根据卷积运算的原有轨迹,完成原有轨迹一次卷积运算的相加运算,这里采用Crossbar结构,完成卷积运算的输出。数据传输单元包括数据仲裁模块、数据读取模块;数据仲裁模块根据此层数据卷积运算卷积核和图像数据的规模大小,对应数据的重用频度分布,判定选取二维图像数据的拼接区域大小;当图像数据和卷积核的规模确定时,整个图像数据的重用频度分布在卷积运算算法的基础上已经确定,在电压可调缓存单元,不同数据读取频度存放在不同存储片区上,以降低功耗开销;数据读取模块,根据切割图片大小,将此区域数据多行拼接为一行,进入电压可调缓存单元。电压可调缓存本文档来自技高网
...
一种面向卷积神经网络的低功耗电压可调卷积运算模块

【技术保护点】
一种面向卷积神经网络的低功耗电压可调卷积运算模块,其特征在于:包括数据传输单元、电压可调缓存单元和卷积计算单元;所述数据传输单元,用于传输图像数据进入电压可调缓存单元;电压可调缓存单元用以根据数据重用频度,将数据分布于不同电压的存储片区;卷积计算单元卷将存储片区的数据进行卷积运算,输出运算结果;所述数据传输单元,将计算数据根据此次卷积运算的卷积核及图片的规模大小,获得图像数据重用分布,切割合适宽度数据块转换为一维数据进入电压可调缓存单元;在电压可调缓存单元,根据进入电压可调缓存单元的一维数据的重用次数累加和,与达到此累加和的先后顺序,仲裁在缓存单元中不同存储片区的排布,按重用频度从高到低的排布,选取高重用频度数据进入高电压缓存区域,低重用频度数据进入低电压缓存区域,根据频度重用数据占比来调节存储片区电压;在卷积计算单元中,使多个卷积核同时对缓存中一个片区的数据进行卷积,这里并行实现,且在电压可调缓存单元中缓存的图像数据需要根据卷积运算的原有轨迹,完成原有轨迹一次卷积运算的相加运算,这里采用Crossbar结构,完成卷积运算的输出。

【技术特征摘要】
1.一种面向卷积神经网络的低功耗电压可调卷积运算模块,其特征在于:包括数据传输单元、电压可调缓存单元和卷积计算单元;所述数据传输单元,用于传输图像数据进入电压可调缓存单元;电压可调缓存单元用以根据数据重用频度,将数据分布于不同电压的存储片区;卷积计算单元卷将存储片区的数据进行卷积运算,输出运算结果;所述数据传输单元,将计算数据根据此次卷积运算的卷积核及图片的规模大小,获得图像数据重用分布,切割合适宽度数据块转换为一维数据进入电压可调缓存单元;在电压可调缓存单元,根据进入电压可调缓存单元的一维数据的重用次数累加和,与达到此累加和的先后顺序,仲裁在缓存单元中不同存储片区的排布,按重用频度从高到低的排布,选取高重用频度数据进入高电压缓存区域,低重用频度数据进入低电压缓存区域,根据频度重用数据占比来调节存储片区电压;在卷积计算单元中,使多个卷积核同时对缓存中一个片区的数据进行卷积,这里并行实现,且在电压可调缓存单元中缓存的图像数据需要根据卷积运算的原有轨迹,完成原有轨迹一次卷积运算的相加运算,这里采用Crossbar结构,完成卷积运算的输出。2.根据权利要求1所述的一种面向卷积神经网络的低功耗电压可调卷积运算模块,其特征在于:所述数据传输单元包括数据仲裁模块、数据读取模块;所述数据仲裁模块根据此层数据卷积运算卷积核和图像数据的规模大小,对应数据的重用频度分布,判定选取二维图像数据的拼接区域大小;当图像数据和卷积核的规模确定时,整个图像数据的重用频度分布在卷积运算算法的基础上已经确定,在电压可调缓存单元,不同数据读取频度存放在不同存储片区上,以降低功耗开销;所述数据读取模块,根据切割图片大小,将此区域数据多行拼接为一行,进入电压可调缓存单元。3.根据权利要求1或2所述的一种面向卷积神经网络的低功耗电压可调卷积运算模块,其特征在于:所述电压可调缓存单元,包括重用频度判断模块、...

【专利技术属性】
技术研发人员:龚宇刘波朱智洋徐亭亭杨军时龙兴
申请(专利权)人:东南大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1