【技术实现步骤摘要】
卷积神经网络Valid卷积的向量化实现方法
本专利技术涉及向量处理器,尤其涉及一种卷积神经网络Valid卷积的向量化实现方法。
技术介绍
近年来基于深度卷积神经网络的深度学习模型在图像识别和分类、目标检测、视频分析等方面取得了令人瞩目的成就,成为学术界和工业界的研究热点,并且促进了人工智能、大数据处理、处理器等相关技术的快速发展。卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetworks),是深度学习的代表算法之一。卷积神经网络的输入层可以处理多维数据,由于卷积神经网络在计算机视觉领域应用最为广泛,因此在设计卷积神经网络结构时通常都是设定三维的输入数据,即二维平面上的图像像素数据和RGB通道。卷积神经网络主要有Valid卷积和Same卷积两种,其中Valid卷积不对输入图像填充0元素,而Same卷积则需要对输入图像的边缘填充0元素。在Valid卷积计算过程中,每一个新图像特征值的计算都是通过6层循环, ...
【技术保护点】
1.一种卷积神经网络Valid卷积的向量化实现方法,其特征在于,步骤包括:/n步骤1:将用于卷积神经网络计算的输入特征数据集数据按照样本维优先的方式存储,即所述输入特征数据集数据按照N*M阶的矩阵连续存储在向量处理器的片外存储器,其中M为数据集的总样本数目;N为单个样本的输入特征数目;以及将卷积核的数据按照卷积核的数量维优先的方式存储;/n步骤2:向量处理器按列将所述输入特征数据集数据矩阵划分为多个矩阵块,得到多个输入特征数据矩阵;/n步骤3:向量处理器每次将所述卷积核数据矩阵传输到各个核的标量存储器SM中,以及将从所述输入特征数据矩阵中按行抽取K行数据组成的子矩阵传输到各 ...
【技术特征摘要】
1.一种卷积神经网络Valid卷积的向量化实现方法,其特征在于,步骤包括:
步骤1:将用于卷积神经网络计算的输入特征数据集数据按照样本维优先的方式存储,即所述输入特征数据集数据按照N*M阶的矩阵连续存储在向量处理器的片外存储器,其中M为数据集的总样本数目;N为单个样本的输入特征数目;以及将卷积核的数据按照卷积核的数量维优先的方式存储;
步骤2:向量处理器按列将所述输入特征数据集数据矩阵划分为多个矩阵块,得到多个输入特征数据矩阵;
步骤3:向量处理器每次将所述卷积核数据矩阵传输到各个核的标量存储器SM中,以及将从所述输入特征数据矩阵中按行抽取K行数据组成的子矩阵传输到各个核的向量阵列存储器AM中,K为单个卷积核的像素数据数目;
步骤4:对各个核的标量存储器SM、向量阵列存储器AM中数据执行向量化矩阵乘法计算以及并行化矩阵乘法计算,得到输出特征数据矩阵计算结果;
步骤5:将所述输出特征矩阵计算结果存储在向量处理器的片外存储器中;
步骤6:重复步骤3~5,直到完成全部输入特征数据矩阵计算。
2.根据权利要求1所述的卷积神经网络Valid卷积的向量化实现方法,其特征在于,所述步骤1中将用于卷积神经网络计算的输入特征数据集数据按照样本维优先的方式存储包括:第一层卷积神经网络计算时,将输入特征的数据集数据重排序,使得输入特征的数据集数据按照N*M阶的矩阵连续存储在向量处理器的片外存储器,其他层计算的输入特征数据矩阵为上一层计算结果的输出特征矩阵,且是按照样本维优先的方式存储在向量处理器的片外存储器中,其中M为数据集的总样本数目,N为单个样本的输入特征数目。
3.根据权利要求2所述的卷积神经网络Valid卷积的向量化实现方法,其特征在于,所述步骤1中将卷积核的数据按照卷积核的数量维优先的方式存储包括:将卷积核的数据按照K*nextC阶的矩阵连续存储在向量处理器的片外存储器中,其中nextC为卷积核的数量。
4.根据权利要求3所述的卷积神经网络Valid卷积的向量化实现方法,其特征在于,所述步骤2中,具体按列将所述输入特征数据集数据矩阵划分为num个矩阵块,每个矩阵块的大小为N*MB阶,其中MB=q*p,M=num*MB,q为目标向量处理器的核数,p为每个核的向量处理单元VPE个数。
5.根据权利要求1~4中任意一项所述的卷积神经网络Valid卷积的向量化实现方法,其特征在于,所述步骤3中,所述按行抽取K行数据组成的子矩阵的总次数具体为nextH*nextW,其中:
nextH=((preH-kernelH)/stepLen+1),nextW=((preW-kernelW)/stepLen+1)
其中,nextH为输出图像数据的高度,nextW为输出图像数据的宽度,preH、preW分别为当前计算层的卷积神经网络的二维图像输入数据的图像高度、图像宽度,stepLen为步长。
6.根据权利要求1~4中任意一项...
【专利技术属性】
技术研发人员:刘仲,郭阳,邓林,田希,扈啸,陈海燕,孙书为,马媛,曹坤,吴立,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。