用于生成卷积神经网络的方法和装置制造方法及图纸

技术编号：18498106 阅读：27 留言：0更新日期：2018-07-21 20:39

本申请实施例公开了用于生成卷积神经网络的方法和装置。该方法的一具体实施方式包括：获取卷积神经网络的目标卷积层的初始输入值和初始权重；根据量化编码的位数，将初始输入值的范围和初始权重的范围分别均匀划分为预设数目个子区间，以分别生成第一输入值集合和第一权重集合；对第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合；将第二输入值集合作为输入，将第二权重集合作为目标卷积层的权重，进行卷积运算；通过迭代训练对初始权重进行修正，直至卷积神经网络满足第一预设条件，生成并存储目标卷积神经网络。该实施方式有助于丰富卷积神经网络的生成方法。

Methods and devices for generating convolution neural networks

The embodiment of the application discloses a method and device for generating convolution neural network. A specific implementation of this method includes obtaining the initial input value and initial weight of the target coiling layer of the convolution neural network, and dividing the range of initial input value and the range of initial weight into a preset number of sub intervals according to the quantized number of digits, in order to separate the first set of input values and the first weight. The second input value set and the second weight set are generated by the first input value and the first weight set in the first weight set, and the second input value set is used as the input, and the second weight set is the weight of the target coiling layer, and the convolution operation is carried out. After iterative training, the initial weights are corrected until convolution neural network satisfies the first preset condition, and the target convolution neural network is generated and stored. The implementation method is helpful to enrich the generation method of convolution neural network.

全部详细技术资料下载

【技术实现步骤摘要】
用于生成卷积神经网络的方法和装置
本申请实施例涉及计算机
，具体涉及神经网络
，尤其涉及用于生成卷积神经网络的方法和装置。
技术介绍
深度学习的概念源于人工神经网络的研究。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。同机器学习方法一样，深度机器学习方法也有监督学习与无监督学习之分。不同的学习框架下建立的学习模型很是不同。例如，卷积神经网络(ConvolutionNeuralNetwork，简称CNN)就是一种深度的监督学习下的机器学习模型；而深度置信网(DeepBeliefNet，简称DBN)就是一种无监督学习下的机器学习模型。
技术实现思路
本申请实施例提出了用于生成卷积神经网络的方法和装置。第一方面，本申请实施例提供了一种用于生成卷积神经网络的方法，包括：获取卷积神经网络的目标卷积层的初始输入值和初始权重；根据量化编码的位数，将初始输入值的范围和初始权重的范围分别均匀划分为预设数目个子区间，其中，预设数目与量化编码的位数正相关；根据位于预设数目个子区间中的各输入值和各权重，分别生成第一输入值集合和第一权重集合；对第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合；将第二输入值集合作为输入，将第二权重集合作为目标卷积层的权重，进行卷积运算；通过迭代训练对初始权重进行修正，直至卷积神经网络满足第一预设条件，将卷...

【技术保护点】
1.一种用于生成卷积神经网络的方法，包括：获取卷积神经网络的目标卷积层的初始输入值和初始权重；根据量化编码的位数，将所述初始输入值的范围和所述初始权重的范围分别均匀划分为预设数目个子区间，其中，所述预设数目与所述量化编码的位数正相关；根据位于预设数目个子区间中的各输入值和各权重，分别生成第一输入值集合和第一权重集合；对所述第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合；将所述第二输入值集合作为输入，将所述第二权重集合作为所述目标卷积层的权重，进行卷积运算；通过迭代训练对所述初始权重进行修正，直至所述卷积神经网络满足第一预设条件，将所述卷积神经网络作为目标卷积神经网络，并存储所述目标卷积神经网络。

【技术特征摘要】
1.一种用于生成卷积神经网络的方法，包括：获取卷积神经网络的目标卷积层的初始输入值和初始权重；根据量化编码的位数，将所述初始输入值的范围和所述初始权重的范围分别均匀划分为预设数目个子区间，其中，所述预设数目与所述量化编码的位数正相关；根据位于预设数目个子区间中的各输入值和各权重，分别生成第一输入值集合和第一权重集合；对所述第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合；将所述第二输入值集合作为输入，将所述第二权重集合作为所述目标卷积层的权重，进行卷积运算；通过迭代训练对所述初始权重进行修正，直至所述卷积神经网络满足第一预设条件，将所述卷积神经网络作为目标卷积神经网络，并存储所述目标卷积神经网络。2.根据权利要求1所述的方法，其中，所述根据量化编码的位数，将所述初始输入值的范围和所述初始权重的范围分别均匀划分为预设数目个子区间，包括：将所述初始输入值的范围放缩至预设范围内，并将该预设范围均匀划分为预设数目个子区间，其中，所述预设范围的边界值为整数；将所述初始权重的范围均放缩至所述预设范围内，并将该预设范围均匀划分为所述预设数目个子区间。3.根据权利要求2所述的方法，其中，所述根据位于预设数目个子区间中的各输入值和各权重，分别生成第一输入值集合和第一权重集合，包括：将所述预设范围内的各输入值作为第一输入值，生成第一输入值集合，并将所述预设范围内的各权重作为第一权重，生成第一权重集合。4.根据权利要求1所述的方法，其中，所述对所述第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合，包括：根据预设量化方法，对所述第一输入值集合中的各第一输入值进行量化取整，并将量化取整后的第一输入值作为第二输入值，生成第二输入值集合；根据所述第一权重集合中的各第一权重的分布概率，对所述第一权重集合中的各第一权重进行上取整或下取整，并将取整后的第一权重作为第二权重，生成第二权重集合。5.根据权利要求1所述的方法，其中，所述根据量化编码的位数，将所述初始输入值的范围和所述初始权重的范围分别均匀划分为预设数目个子区间之前，所述方法还包括：统计所述初始权重的分布信息；根据所述分布信息，确定所述初始权重中是否存在满足第二预设条件的初始权重；响应于确定存在满足第二预设条件的初始权重，对满足所述第二预设条件的初始权重进行处理，其中，处理方法包括截断或缩放满足第二预设条件的初始权重。6.根据权利要求1-5之一所述的方法，其中，所述方法还包括：获取所述目标卷积神经网络的目标卷积层的初始输入信息；对所述初始输入信息进行量化取整，得到整数输入值；将所述整数输入值输入所述目标卷积层，并与所述目标卷积层的权重进行卷积运算，生成输出信息。7.一种用于生成卷积神经网络的装置，包括：第一获取单元，配置用于获取卷积神经网络的目标卷积层的初始输入值和初始权重；划分单元，配置用于...

【专利技术属性】
技术研发人员：姜志超，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人