用于存储数据的方法和装置制造方法及图纸

技术编号:20285140 阅读:41 留言:0更新日期:2019-02-10 17:46
本申请实施例公开了用于存储数据的方法和装置。该方法的一具体实施方式包括:从预设的卷积神经网络中的目标特征矩阵中,确定待与目标特征矩阵对应的权重矩阵进行卷积运算的子特征矩阵;执行如下存储步骤:从权重矩阵中的、未提取过的权重数据中,提取预设数量个权重数据及存储到第一目标寄存器中;从子特征矩阵中的、未提取过的特征数据中,提取预设数量个特征数据及存储到第二目标寄存器中;确定权重矩阵中的、未提取过的权重数据的数量和子特征矩阵中的、未提取过的特征数据的数量是否均大于等于预设数量;响应于确定均大于等于预设数量,继续执行存储步骤。该实施方式有助于利用寄存器的存取速度快的特点,提高卷积神经网络的运算效率。

Method and device for storing data

The embodiment of this application discloses methods and devices for storing data. One specific implementation of the method includes: determining the sub-feature matrix of the weight matrix corresponding to the target feature matrix from the target feature matrix of the preset convolution neural network for convolution operation; performing the following storage steps: extracting the preset number of weight data from the weight matrix and storing it in the first target register; The preset number of feature data is extracted from the feature data of the sub-feature matrix which has not been extracted and stored in the second target register; whether the number of the non-extracted weight data in the weight matrix and the number of the non-extracted feature data in the sub-feature matrix are greater than or equal to the preset number is determined; and continue to persist in response to the determination that both are greater than or equal to the preset number. Row storage step. The implementation is helpful to improve the operation efficiency of convolutional neural networks by taking advantage of the fast access speed of registers.

【技术实现步骤摘要】
用于存储数据的方法和装置
本申请实施例涉及计算机
,具体涉及用于存储数据的方法和装置。
技术介绍
卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。CNN包括卷积层(convolutionallayer)、池化层(poolinglayer)等。在对这些层中的数据进行卷积运算时,通常需要将其中的特征矩阵(即矩阵形式的特征图(featuremap))包括的特征数据与权重矩阵(即矩阵形式的卷积核(又称为滤波器))包括的权重数据相乘。
技术实现思路
本申请实施例提出了用于存储数据的方法和装置。第一方面,本申请实施例提供了一种用于存储数据的方法,该方法包括:从预设的卷积神经网络中的目标特征矩阵中,确定待与目标特征矩阵对应的权重矩阵进行卷积运算的子特征矩阵;执行如下存储步骤:从权重矩阵中的、未提取过的权重数据中,提取预设数量个权重数据及存储到第一目标寄存器中;从子特征矩阵中的、未提取过的特征数据中,提取预设数量个特征数据及存储到第二目标寄存器中;确定权重矩阵中的、未提取过本文档来自技高网...

【技术保护点】
1.一种用于存储数据的方法,包括:从预设的卷积神经网络中的目标特征矩阵中,确定待与所述目标特征矩阵对应的权重矩阵进行卷积运算的子特征矩阵;执行如下存储步骤:从所述权重矩阵中的、未提取过的权重数据中,提取预设数量个权重数据及存储到第一目标寄存器中;从所述子特征矩阵中的、未提取过的特征数据中,提取预设数量个特征数据及存储到第二目标寄存器中;确定所述权重矩阵中的、未提取过的权重数据的数量和所述子特征矩阵中的、未提取过的特征数据的数量是否均大于等于所述预设数量;响应于确定均大于等于所述预设数量,继续执行所述存储步骤。

【技术特征摘要】
1.一种用于存储数据的方法,包括:从预设的卷积神经网络中的目标特征矩阵中,确定待与所述目标特征矩阵对应的权重矩阵进行卷积运算的子特征矩阵;执行如下存储步骤:从所述权重矩阵中的、未提取过的权重数据中,提取预设数量个权重数据及存储到第一目标寄存器中;从所述子特征矩阵中的、未提取过的特征数据中,提取预设数量个特征数据及存储到第二目标寄存器中;确定所述权重矩阵中的、未提取过的权重数据的数量和所述子特征矩阵中的、未提取过的特征数据的数量是否均大于等于所述预设数量;响应于确定均大于等于所述预设数量,继续执行所述存储步骤。2.根据权利要求1所述的方法,其中,所述存储步骤还包括:响应于确定所述权重矩阵中的、未提取过的权重数据的数量和所述子特征矩阵中的、未提取过的特征数据的数量均大于零且小于所述预设数量,将所述权重矩阵中的、未提取过的权重数据存储到第一目标寄存器中,以及将所述子特征矩阵中的、未提取过的特征数据存储到第二目标寄存器中。3.根据权利要求1所述的方法,其中,所述卷积神经网络中的特征矩阵包括的特征数据和权重矩阵包括的权重数据是预设位数的定点数。4.根据权利要求1所述的方法,其中,所述存储步骤还包括:对于存储在第一目标寄存器中的各个权重数据中的权重数据,将该权重数据乘以对应的、存储在第二目标寄存器中的特征数据,得到乘积;将所得到的乘积存储到预设的存储区域中。5.根据权利要求1所述的方法,其中,所述目标特征矩阵包括的特征数据和所述权重矩阵包括的权重数据预先存储在预设缓存中。6.根据权利要求1-5之一所述的方法,其中,所述预设数量是预设的单指令多数据流SIMD指令单次提取的数据的位数与所述卷积神经网络中的特征矩阵包括的特征数据的位数的商。7.根据权利要求6所述的方法,其中,所述从所述权重矩阵中的、未提取过的权重数据中,提取预设数量个权重数据及存储到第一目标寄存器中,包括:基于所述SIMD指令从所述权重矩阵中的、未提取过的权重数据中,提取预设数量个权重数据及存储到第一目标寄存器中。8.根据权利要求6所述的方法,其中,所述从所述子特征矩阵中的、未提取过的特征数据中,提取预设数量个特征数据及存储到第二目标寄存器中,包括:基于所述SIMD指令从所述子特征矩阵中的、未提取过的特征数据中,提取预设数量个特征数据及存储到第二目标寄存器中。9.一种用于存储数据的装置,包括:第一确定单元,被配置成从预设的卷积神经网络中的目标特征矩阵中,确定待与所述目标特征矩阵对应的权重矩阵进行卷积运算的子特...

【专利技术属性】
技术研发人员:胡耀全
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1