一种用于神经网络中反卷积计算的加速系统及方法技术方案

技术编号:34347998 阅读:19 留言:0更新日期:2022-07-31 05:10
本发明专利技术提供一种用于神经网络中反卷积计算的加速系统及方法,本发明专利技术通过利用所提特定法则来重分配处理单元PE所存权重,使得加速器支持在一个计算周期内配合数据输入模块完成同一计算模式下特定位置像素值的反卷积计算,以此提高反卷积计算速度以及处理单元PE的利用率,降低了硬件资源的空闲率,关键的是,数据输入模块的数据输入缓冲时间也因此得到优化;此外,通过结果融合模块能有效融合不同处理单元PE在同一计算周期中输出的结果,使得加速器的硬件工作性能得到优化。的硬件工作性能得到优化。的硬件工作性能得到优化。

【技术实现步骤摘要】
一种用于神经网络中反卷积计算的加速系统及方法


[0001]本专利技术涉及神经网络中反卷积计算任务的硬件加速领域,更具体地,涉及一种用于神经网络中反卷积计算的加速系统及方法。

技术介绍

[0002]反卷积也被称为转置卷积,广义上是卷积的一种逆运算,属于上采样的一种常用方法,目前是深度神经网络中的关键任务。与常规卷积计算相比,反卷积计算会产生更多额外操作,从而导致性能和能耗瓶颈。存储计算一体化(PIM)是一种部署深度神经网络的新范式,其中基于可变电阻式存储器(ReRAM)的PIM是一种强有效的方法,已被广泛应用于常规卷积计算任务中,但是由于计算的高度复杂性而没被大量应用于反卷积计算任务中。
[0003]为了进一步将ReRAM应用于深度神经网络的部署,前人研究设计基于ReRAM可变电阻式存储器的反卷积加速器RED,通过消除冗余和额外的操作以达到加速反卷积计算任务的结果。文献“Ziru Li,et al.RED:A ReRAM

Based Efficient Accelerator for Deconvolutional C本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于神经网络中反卷积计算的加速系统,其特征在于,包括:原始特征图模块,用于存储待进行反卷积计算的原始特征图;数据输入模块,用于按反卷积的计算模式,成批输送特征图待计算的像素值到下一模块;反卷积计算模块,用于按特定法则重分配每个处理单元PE所含权重,进而加速并完成反卷积的计算;结果融合模块,用于将不同计算模式的反卷积结果融合在同一输出特征图上。2.根据权利要求1所述的用于神经网络中反卷积计算的加速系统,其特征在于,所述反卷积计算模块由多个按所提法则映射权重的处理单元PE组成,从数据输入模块的数据输入模块成批地接收同一计算模式下特征图特定位置的像素值,通过数据通路将不同位置的像素值分别分配给预先设置好的不同计算单元PE,在一个计算周期内并行计算出同一计算模式的所有特定位置像素值的反卷积结果。3.根据权利要求2所述的用于神经网络中反卷积计算的加速系统,其特征在于,所述结果融合模块是一个反卷积计算结果处理装置,其通过数据通路将反卷积计算模块的同一计算模式下的反卷积结果汇聚到同一加法器中进行结果融合,然后按计算模式的顺序依次存放在输出特征图的特定位置,其中,加法器的数量和反卷积计算模式的种类数相等,即存在S2个加法器。4.根据权利要求3所述的用于神经网络中反卷积计算的加速系统,其特征在于,所述反卷积的计算模式是:计算模式1仅对(0,0)、(0,2)、(2,0)、(2,2)位置像素值进行反卷积计算,计算模式2仅对(0,1)、(2,1)位置像素值进行反卷积计算,计算模式3仅对(1,0)、(1,2)位置像素值进行反卷积计算,计算模式4仅对(1,1)位置像素值进行反卷积计算。5.根据权利要求4所述的用于神经网络中反卷积计算的加速系统,其特征在于,所述的特定法则是:首先将卷积核每个位置的权重分别分配给不同的PE,并将同一计算模式下的PE按卷积核位置从左至右从上至下顺序排列在同一行,即第一行包括PE1(0,0)、PE2(0,2)、PE3(2,0)、PE4(2,2),第二行包括PE5(0,1)、PE6(2,1),第三行包括PE7(1,0)、PE8(1,2),第四行包括PE9(1,1);然后将同一行的PE两两合并,若PE数量为奇数则该行最后一个PE权重保持不变,即第一行包括PE1(0,0)+(0,2)、PE2(0,2)+(2,2),第二行包括PE3...

【专利技术属性】
技术研发人员:袁盛海刘博生列校民蔡观富
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1