【技术实现步骤摘要】
本专利技术属于深度学习,尤其涉及一种完全复用gemm和alu架构实现depth-wise卷积的计算方法和装置。
技术介绍
1、卷积神经网络(cnn)通过卷积操作提取输入数据到特征,从而实现数据识别和分类,在图像分类、目标检测等应用领域取得出色效果。cnn中主要是标准卷积层承担提取特征这个重要任务,标准卷积层的输入数据有两个,分别是有多个通道的特征图数据和多个有多个通道的卷积核。随着深度学习在产业中应用范围扩大,移动端和边缘场景中cnn的应用也逐渐普及,然而受到移动端和边缘场景的存储带宽和计算资源的限制,cnn发挥的作用不明显,因此有神经网络模型提出了参数量和计算复杂度更小的depth-wise卷积层,depth-wise卷积层的输入数据是多通道的特征图数据和一个多通道的卷积核,特征图数据和卷积核的通道分别对应,卷积核一个通道负责特征图的一个通道的数据。
2、标准卷积需要累加全部通道的卷积结果,通用的实现方法是采用gemm(generalmatrix-vector multiplication)加速,在三维输入上按通道并行和卷
...【技术保护点】
1.一种完全复用GEMM和ALU架构实现Depth-wise卷积的计算方法,其特征在于,所述方法包括:
2.根据权利要求1所述的完全复用GEMM和ALU架构实现Depth-wise卷积的计算方法,其特征在于,所述步骤1包括如下具体步骤:
3.根据权利要求1所述的完全复用GEMM和ALU架构实现Depth-wise卷积的计算方法,其特征在于,所述步骤1对于采用GEMM的标准卷积层,加速的方式是8个卷积核并行处理,各卷积核按8通道并行进行卷积计算,GEMM在各计算周期按输出通道输出计算结果,共8个输出特征图数据;对于复用GEMM架构的Depth-w
...【技术特征摘要】
1.一种完全复用gemm和alu架构实现depth-wise卷积的计算方法,其特征在于,所述方法包括:
2.根据权利要求1所述的完全复用gemm和alu架构实现depth-wise卷积的计算方法,其特征在于,所述步骤1包括如下具体步骤:
3.根据权利要求1所述的完全复用gemm和alu架构实现depth-wise卷积的计算方法,其特征在于,所述步骤1对于采用gemm的标准卷积层,加速的方式是8个卷积核并行处理,各卷积核按8通道并行进行卷积计算,gemm在各计算周期按输出通道输出计算结果,共8个输出特征图数据;对于复用gemm架构的depth-wise卷积层,加速的方式是8个通道并行处理,各单通道计算单元的8个乘累加器对各通道的8个输入特征图数据和8个权重数据进行卷积计算,gemm在各计算周期按输出通道输出计算结果,共8个输出特征图数据。
4.根据权利要求1所述的完全复用gemm和alu架构实现depth-wise卷积的计算方法,其特征在于,所述步骤2包括如下具体步骤:
5.根据权利要求1所述的完全复用gemm和alu架构实现depth-wise卷积的计算方法,其特征在于,步骤2中,depth-wise卷积层的权重数据块在行列维度上进一步划分成预设尺寸的子权重数据块,其中预设尺寸根据gemm的各单通道计算单元中乘累加器数量确定,当权重数据块不足预设尺寸的整数倍数时,通过行列补零的方式将所述的权重数据块的行列尺寸调整成预设尺寸的整数倍,然后对调整后的权重数据块按相同步骤划分成子权重数据块;
6.根据权利要求1所述的完全复用gemm和alu架构实现depth-wise卷积的计算方法,其特征在于,所述步骤3包括如下具体步骤:
7.根据权利要求1所述的完全复用gemm和alu架构实现depth-wise卷积的计算方法,其特征在于,步骤3中,处理标准卷积层时,本申请的gemm架构的输入是输入特征图数据块和权重数据块,各权重数据块中的数据来自并行处理的卷积核,并行处理的卷积核的数量等于单通道计算单元的预设数量,gemm每次处理的各输入特征图数据块和子权重数据块的通道数等于单通道计算单元的乘累加器数量,处理depth-wise卷积层时, gemm和alu架构的输入是输入特征图数据块和子权重数据块,各输入特征图数据块和各子权重数据块的通道数等于单通道计算单元的数量,gemm在各计算周期各单通道计算单元处理的输入特征图数据和权重数据的个数小于等于单通道计算单元中乘累加器的数量。
8.根据权利要求1所述的完全复用gemm和alu架构实现depth-wise卷积的计算方法,其特征在于,步骤3中,gemm和alu架构计算采用四层循环完成depth-wise卷积,在执行depth-wise卷积过程中,第一层是输入特征图按通道并行的预设数量划分的组数,即输入特征图数据块的个数,输出特征图数据也按...
【专利技术属性】
技术研发人员:黄凯,王铮宇,熊东亮,蒋小文,郑丹丹,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。