【技术实现步骤摘要】
一种粗粒度可重构的卷积神经网络加速器及系统
本专利技术涉及高能效硬件加速器设计
,更具体地,涉及一种粗粒度可重构的卷积神经网络加速器及系统。
技术介绍
卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网络已经成为在图像识别、语音识别等领域最常用的算法,这一类方法需要非常多的计算量,需要设计专用的加速器。在可移动设备中也有很好的应用前景。但由于可移动设备资源受限,目前在GPU和FPGA(FieldProgrammableGateArray,现场可编程门阵列)平台上设计的加速器很难在这些要求低功耗、资源受限的平台上使用。由于卷积神经网络具有多种大小的网络结构和卷积核,专用的卷积网络加速器应该高效的支持这些不同大小的网络以及卷积核。传统的加速器为了支持卷积网络的多样性通常可以被分为两大类;第一大类是指令式加速器,把不同的卷积核计算操作拆解成一条条指令,在同一时刻取出正确的权重数据与图像数据,这种方法需要大量片上带宽和片上存储,在处理 ...
【技术保护点】
一种粗粒度可重构的卷积神经网络加速器,其特征在于,包括多个处理单元簇,所述每个处理单元簇包括若干基本计算单元,所述若干基本计算单元通过一子加法单元连接,所述多个处理单元簇的子加法单元分别连接到一母加法单元;所述每个子加法单元用于产生相邻的若干基本加法单元的部分和,所述母加法单元用于累加所述子加法单元。
【技术特征摘要】
1.一种粗粒度可重构的卷积神经网络加速器,其特征在于,包括多个处理单元簇,所述每个处理单元簇包括若干基本计算单元,所述若干基本计算单元通过一子加法单元连接,所述多个处理单元簇的子加法单元分别连接到一母加法单元;所述每个子加法单元用于产生相邻的若干基本加法单元的部分和,所述母加法单元用于累加所述子加法单元。2.根据权利要求1所述的粗粒度可重构的卷积神经网络加速器,其特征在于,所述基本计算单元包括3×3卷积单元。3.根据权利要求1所述的粗粒度可重构的卷积神经网络加速器,其特征在于,所述处理单元簇为4个,所述4个处理单元簇呈正交矩阵排布;所述每个处理单元簇包括4个基本计算单元,所述4个基本计算单元呈正交矩阵排布。4.根据权利要求2所述的粗粒度可重构的卷积神经网络加速器,其特征在于,所述每个基本计算单元包括9个呈九宫格排布的乘法器,还包括1个加法器,所述同一列...
【专利技术属性】
技术研发人员:袁哲,刘勇攀,杨华中,岳金山,李金阳,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。