【技术实现步骤摘要】
本专利技术属于脉动阵列,具体涉及一种用于cnn计算的脉动阵列重构方法。
技术介绍
1、由asic来实现cnn的计算,采用脉动阵列可较好的解决因数据多并行维度和高并行维度导致的计算数据通路广播过长、扇入扇出太高等问题。然而,在实际应用中,由于输入特征图的尺寸在不同神经网络和不同神经网络层中具有不固定性,导致脉动阵列在实际应用中难以兼容不同的神经网络,当前常规的解决办法是采用脉动阵列矩阵的硬件结构,使得计算过程可根据输入特征图的参数进行实时调整,但是这样会大幅增加后端布局布线的复杂性。
技术实现思路
1、为了解决上述
技术介绍
中提到的至少一个问题,本专利技术提出了提出了一种用于cnn计算的脉动阵列重构方法。
2、一种用于cnn计算的脉动阵列重构方法,包括步骤:
3、步骤s1,系统控制器m0收到加载指令后启动dma模块,将特征数据和权重数据从外部存储器按照一定的排列顺序分别存放在fspm和wspm中;
4、步骤s2,特征数据和权重数据加载完成后,系统控制器m0给
...【技术保护点】
1.一种用于CNN计算的脉动阵列重构方法,其特征在于,包括步骤:
2.根据权利要求1所述的一种用于CNN计算的脉动阵列重构方法,其特征在于,步骤S2中所述的按照PEA的计算维度,具体包括按照常规CNN卷积的维度和按照Depthwise卷积的维度,其中,按照常规CNN卷积维度,其输入特征数据的位宽为8bit,其卷积维度从低到高排列如下:
3.根据权利要求1所述的一种用于CNN计算的脉动阵列重构方法,其特征在于,S2中所述的PEA是以基本处理单元PE为单位,并设计为2行8列的PE矩阵,每个PE包含8个独立的PEM,每个PEM包含16个乘法器和一个累
...
【技术特征摘要】
1.一种用于cnn计算的脉动阵列重构方法,其特征在于,包括步骤:
2.根据权利要求1所述的一种用于cnn计算的脉动阵列重构方法,其特征在于,步骤s2中所述的按照pea的计算维度,具体包括按照常规cnn卷积的维度和按照depthwise卷积的维度,其中,按照常规cnn卷积维度,其输入特征数据的位宽为8bit,其卷积维度从低到高排列如下:
3.根据权利要求1所述的一种用于cnn计算的脉动阵列重构方法,其特征在于,s2中所述的pea是以基本处理单元pe为单位,并设计为2行8列的pe矩阵,每个pe包含8个独立的pem,每个pem包含16个乘法器和一个累加器。
4.根据权利要求1所述的一种用于cnn计算的脉动阵列重构方法,其特征在于,步骤s2所述的bf,其最小组成单元为32个输入通道的特征图,包含两组bf0寄存器和bf1寄存器,每组寄存器包括1行和ρ列,其中,列数ρ满足下列公式:
5.根据权利要求1所述的一种用于cnn计算的脉动阵列重构方法,其特征在于,步骤s...
【专利技术属性】
技术研发人员:李俊文,崔云飞,欧阳鹏,
申请(专利权)人:北京清微智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。