【技术实现步骤摘要】
本申请实施例涉及神经网络领域,尤其涉及一种可重构计算装置、卷积计算方法和电子设备。
技术介绍
1、卷积(convolution)计算广泛应用在图像处理的过程中,由于卷积计算会产生大量的数据搬运需求,对底层处理硬件的数据吞吐量提出了挑战。
2、通过采用粗粒度可重构体系结构(coarse-grained reconfigurablearchitecture,cgra)的处理器进行卷积计算,由于该处理器有高并行度可供开发,因此可以有效提高数据的吞吐量。但是,现有技术中粗粒度可重构体系结构的处理器进行卷积计算时的访存功耗较高。
技术实现思路
1、本申请实施例提供一种可重构计算装置、卷积计算方法和电子设备,解决了粗粒度可重构体系结构的处理器进行卷积计算时访存功耗较高的问题。
2、为达到上述目的,本申请实施例采用如下技术方案:
3、本申请实施例的第一方面,提供一种可重构计算装置,该装置包括:多个计算单元,该多个计算单元用于执行像素矩阵与权重矩阵的卷积计算,像素矩阵包
...【技术保护点】
1.一种可重构计算装置,其特征在于,所述装置包括多个计算单元,所述多个计算单元用于执行像素矩阵与权重矩阵的卷积计算,所述像素矩阵包括多行多列的原始像素,所述权重矩阵包括多行多列的权重值,所述多个计算单元包括第一计算单元和第二计算单元;
2.根据权利要求1所述的可重构计算装置,其特征在于,所述至少一个时间段包括第二时间段,所述第一计算单元在所述第二时间段内接收的所述传输的原始像素包括第二原始像素;
3.根据权利要求2所述的可重构计算装置,其特征在于,所述多个计算单元还包括第三计算单元,所述至少一个时间段还包括第三时间段,所述第一计算单元在所述第三
...【技术特征摘要】
1.一种可重构计算装置,其特征在于,所述装置包括多个计算单元,所述多个计算单元用于执行像素矩阵与权重矩阵的卷积计算,所述像素矩阵包括多行多列的原始像素,所述权重矩阵包括多行多列的权重值,所述多个计算单元包括第一计算单元和第二计算单元;
2.根据权利要求1所述的可重构计算装置,其特征在于,所述至少一个时间段包括第二时间段,所述第一计算单元在所述第二时间段内接收的所述传输的原始像素包括第二原始像素;
3.根据权利要求2所述的可重构计算装置,其特征在于,所述多个计算单元还包括第三计算单元,所述至少一个时间段还包括第三时间段,所述第一计算单元在所述第三时间段内接收的所述传输的原始像素包括第三原始像素;
4.根据权利要求1-3中的任一项所述的可重构计算装置,其特征在于,当n的取值等于0时,所述第一时间段包括所述卷积计算的第nk2周期所在的时间段,当n的取值大于或等于1时,所述第一时间段包括所述卷积计算的第nk2-1周期所在的时间段,其中n为自然数,k为所述权重矩阵的边长。
5.根据权利要求1-4中的任一项所述的可重构计算装置,其特征在于,所述至少一个时间段包括所述卷积计算的第nk+1~(n+1)k-1周期所在的时间段,n为自然数,k为所述权重矩阵的边长;
6.根据权利要求1-5中的任一项所述的可重构计算装置,其特征在于,所述至少一个时间段还包括卷积计算的第(n+1)k周期所在的时间段,n为自然数,k为所述权重矩阵的边长;
7.根据权利要求1-6中的任一项所述的可重构计算装置,其特征在于,所述第一计算单元包括本地寄存器、第一加载操作单元和乘累加计算单元;
8.根据权利要求1-7中任一项所述的可重构计算装置,其特征在于,所述装置还包括与所述第一计算单元耦合的全局寄存器;
9.根据权利要求1-8中任一项所述的可重构计算装置,其特征在于,所述装置还包括第四计算单元,所述第四计算单元包括第二加载操作单元和存储操作单元;
10.一种卷积计算方法,其特征在于,所述方法应用于包括多个计算单元的可重构计算装置,所述多个计算单元用于执行像素矩阵与权重矩阵的卷积计算,所述像素矩...
【专利技术属性】
技术研发人员:尹首一,张士长,王海军,邓金易,胡旭阳,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。