【技术实现步骤摘要】
一种基于可重构技术的用于加速卷积和池化运算的装置
本专利技术属于集成电路
,具体涉及一种深度神经网络算法中用于卷积和池化运算的装置。
技术介绍
如今,深度神经网络算法在计算机视觉、自然语言处理等领域展现出惊人的潜力。为了提高深度神经网络算法的计算能效,技术人员们开发了一系列的深度神经网络算法加速芯片。深度卷积神经网络算法是目前使用最广泛的深度神经网络算法之一,它一般由卷积层、池化层等若干层不同的运算连接而成。其中池化运算又分成最大池化和平均池化两种不同的运算。目前已有的架构中,为了处理池化运算,有两种技术路线。第一种,是使用CPU等通用处理单元计算池化运算,但是CPU等通用处理单元处理池化运算的并行性较低,且在卷积加速模块和CPU等通用处理单元之间传输数据需要占据大量的总线带宽,进而影响权重等总线数据传输。第二种,是采用多个不同结构的运算加速模块进行分别对不同的运算进行加速,这会浪费芯片的面积和功耗。综上所述,如何设计一个架构同时高效地兼容上述三种运算,是相关领域技术人员亟需解决的一个问题。
技术实现思路
本专利技术的目的在于提供一种高效的用于深度神经网络算法中 ...
【技术保护点】
1.一种基于可重构技术的用于加速卷积和池化运算的装置,其特征在于,包括:可重构计算单元,用于重构成卷积、最大池化、平均池化三个模式,进行计算;特征值存储模块,用于存储参加计算的特征值;卷积权重存储模块,用于存储卷积运算的滤波器权重;控制模块,用于接收上位机的指令,对所述可重构计算单元进行动态重构;其中,所述可重构计算单元,在所述控制模块的控制下,从所述特征值存储模块中读取参与计算的特征值,在卷积模式时同时从卷积权重存储模块中读取权重,进行计算后将结果写回特征值存储模块中。
【技术特征摘要】
1.一种基于可重构技术的用于加速卷积和池化运算的装置,其特征在于,包括:可重构计算单元,用于重构成卷积、最大池化、平均池化三个模式,进行计算;特征值存储模块,用于存储参加计算的特征值;卷积权重存储模块,用于存储卷积运算的滤波器权重;控制模块,用于接收上位机的指令,对所述可重构计算单元进行动态重构;其中,所述可重构计算单元,在所述控制模块的控制下,从所述特征值存储模块中读取参与计算的特征值,在卷积模式时同时从卷积权重存储模块中读取权重,进行计算后将结果写回特征值存储模块中。2.根据权利要求1所述的装置,其特征在于,所述的可重构计算单元,包括一个乘法器和一个累加器;其中:可重构计算单元的乘法器,具有以下特征:第一个乘法因数输入端口接收来自所述特征值存储模块的输入特征值;第二个乘法因数输入端口可以被重构为接收来自所述卷积权重存储模块的卷积滤波器权重,或被直接重构为立即数;可重构计算单元的累加器,具有以下特征:所述累加器由一个加法器和一个结果寄存器组成;所述加法器接收来自所述乘法器的输出,将其与所述结果寄存器中存储的数值相加后,产生加法器的输出。3.根据权利要求1所述的装置,其特征在于,在每次卷积或池化运算开始前,结果寄存器中存储的数值进行初始化。4.根据权利要求1-3之一所述的装置,其特征在于,在不同的可重构模式下,可重构单元的电路行为不同,具体如下:卷积模式的计算流程为:(1)累加器的结果寄存器初始化为零,或者初始化为偏置;(2)将乘法器的第2个乘法因数输入端口配置成从卷积权重存储模块接收滤波器权重;(3)可重构计算单元从特征值存储模块中接收输入特征值,经乘法器与相应的滤波器权重相乘后,与结果寄存器中的数值相加,将相加获得的部分和存储在结果寄存器中;(4)反复步骤(...
【专利技术属性】
技术研发人员:朱浩哲,王彧,张怡云,史传进,
申请(专利权)人:复旦大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。