The invention discloses a method for realizing vector of a GPDSP oriented deconvolution matrix, the distribution of scalar storage space and the corresponding vector storage space by GPDSP CPU kernel weight matrix and inverse convolution neural network in the propagation phase of the residual matrix calculation stage, which comprises the following steps: S1, a A (residual matrix M, m, B (n), the weight matrix n) and matrix C (m+n deconvolution results 1, 1, and m> m+n); n; S2: by controlling the number of cycles, first calculate the deconvolution result matrix C n before 1 elements; S3: fixed cycles, calculation results of deconvolution matrix C the n to m elements; S4: by control cycle times, the calculation results from the deconvolution matrix C n 1 to first last elements. The invention has the advantages of simple principle, convenient operation, complete utilization of a vector processor, special data calculation, shortening the running time of the whole algorithm, and improving the efficiency of the algorithm execution, etc..
【技术实现步骤摘要】
一种面向GPDSP的反卷积矩阵的向量化实现方法
本专利技术主要涉及到向量处理器及机器学习领域,特指一种面向GPDSP的反卷积矩阵的向量化实现方法。
技术介绍
深度学习(DeepLearning,DL)是当前机器学习领域的一个重要研究方向。DL通过构造多层感知器(MultilayerPerception,MLP)来模拟人脑的分层感知方式,MLP能够通过组合低层次特征来表达属性类别或高层的抽象特征,从而成为当前目标识别领域的研究重点。经典的DL模型主要包括自动编码机模型(AutoEncode,AE)、深度信念网络模型(DeepBeliefNetworks,DBNs)及卷积神经网络模型(ConvolutionalNeuralNetworks,CNN)。一般来说,上述模型主要通过编码器从输入图像中提取特征,从底层逐层向上将图像转化到高层特征空间,相应的,使用解码器将高层特征空间的特征通过网络自顶向下重构输入图像。其中,深度学习模型主要分为无监督学习模型和有监督学习模型,自动编码机和深度信念网络就是无监督学习模型的代表,它们可以自底向上地逐层学习丰富的图像特征并为高层次应用 ...
【技术保护点】
一种面向GPDSP的反卷积矩阵的向量化实现方法,其特征在于,由GPDSP的CPU核为卷积神经网络中前向传播阶段产生的权值矩阵及反向计算阶段的残差矩阵分配相应的标量存储空间和向量存储空间,其步骤为,S1:设残差矩阵A(m,m)、权值矩阵B(n,n)及反卷积结果矩阵C(m+n‑1,m+n‑1),且m>n;S2:通过控制循环次数,首先计算反卷积结果矩阵C前n‑1行元素;S3:固定循环次数,计算反卷积结果矩阵C第n行至第m行元素;S4:通过控制循环次数,计算反卷积结果矩阵C倒数第n‑1行至倒数第1行元素。
【技术特征摘要】
1.一种面向GPDSP的反卷积矩阵的向量化实现方法,其特征在于,由GPDSP的CPU核为卷积神经网络中前向传播阶段产生的权值矩阵及反向计算阶段的残差矩阵分配相应的标量存储空间和向量存储空间,其步骤为,S1:设残差矩阵A(m,m)、权值矩阵B(n,n)及反卷积结果矩阵C(m+n-1,m+n-1),且m>n;S2:通过控制循环次数,首先计算反卷积结果矩阵C前n-1行元素;S3:固定循环次数,计算反卷积结果矩阵C第n行至第m行元素;S4:通过控制循环次数,计算反卷积结果矩阵C倒数第n-1行至倒数第1行元素。2.根据权利要求1所述的面向GPDSP的反卷积矩阵的向量化实现方法,其特征在于,所述权值矩阵B置于标量存储体,反卷积矩阵A置于向量存储体,且权值矩阵B从后至前,倒序来取。3.根据权利要求1或2所述的面向GPDSP的反卷积矩阵的向量化实现方法,其特征在于,所述步骤S2的详细步骤为:S2.1取权值矩阵B第n行的最后一个元素,bn-1,n-1,取残差矩阵A第一行元素,将bn-1,n-1广播至标量寄存器中的元素与矩阵A第一行元素对应相乘,累加上将bn-1,n-2向量化后与移位后的...
【专利技术属性】
技术研发人员:郭阳,张军阳,扈啸,王慧丽,胡敏慧,王子聪,
申请(专利权)人:中国人民解放军国防科学技术大学,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。