This is a page open method, a training model of convolutional neural network device and storage medium to deep learning technology field, the method includes: for the model including convolutional neural network multiple hidden layer in each hidden layer, select the target node probability hidden hidden layer from the hidden layer includes multiple nodes in based on the multi layer hidden probability is not the same; the training of convolutional neural network model from multiple hidden layer based on the selection of the target node. Because of the hidden layer of different corresponding to different input values, therefore, when using different training probability hidden from the hidden layer in different destination nodes, compared with the related technology of all hidden layers were using the same hidden probability for training, image recognition can improve the convolutional neural network model of effective accuracy.
【技术实现步骤摘要】
训练卷积神经网络模型的方法、装置及存储介质
本公开涉及深度学习
,尤其涉及一种训练卷积神经网络模型的方法、装置及存储介质。
技术介绍
近年来,深度学习技术被广泛的用于图像识别和分类领域。其中,深度学习技术中采用的卷积神经网络模型一般均为多层的卷积网络。在训练该卷积神经网络模型时,如果训练集中的样本较少,就容易导致过拟合,从而造成图像识别准确率降低。为了解决上述问题,可以采用Dropout算法对卷积神经网络模型进行训练。相关技术中,卷积神经网络模型可以包括一个输入层、一个输出层和多个隐含层,该多个隐含层位于输入层和输出层之间,输入层与第一个隐含层连接,第一个隐含层的输出值作为与其相邻的下一个隐含层的输入值,最后一个隐含层的输出值则作为输出层的输入值。当采用Dropout算法对卷积神经网络模型进行训练时,对于卷积神经网络模型中的每个隐含层,可以根据预设概率从该隐含层包括的多个节点中选择目标节点,并根据从该多个隐含层中选择的目标节点对卷积神经网络模型进行训练。
技术实现思路
为克服相关技术中采用相同的预设概率对卷积神经网络模型进行训练时造成的卷积神经网络模型的图像识别 ...
【技术保护点】
一种训练卷积神经网络模型的方法,其特征在于,所述方法包括:对于卷积神经网络模型包括的多个隐含层中的每个隐含层,基于所述隐含层的隐藏概率从所述隐含层包括的多个节点中选择目标节点,所述多个隐含层的隐藏概率不相同;基于从所述多个隐含层中选择的目标节点对所述卷积神经网络模型进行训练。
【技术特征摘要】
1.一种训练卷积神经网络模型的方法,其特征在于,所述方法包括:对于卷积神经网络模型包括的多个隐含层中的每个隐含层,基于所述隐含层的隐藏概率从所述隐含层包括的多个节点中选择目标节点,所述多个隐含层的隐藏概率不相同;基于从所述多个隐含层中选择的目标节点对所述卷积神经网络模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述基于所述隐含层的隐藏概率从所述隐含层包括的多个节点中选择目标节点之前,还包括:确定所述卷积神经网络模型包括的多个隐含层中每个隐含层的隐藏概率,所述多个隐含层的隐藏概率按照所述多个隐含层输出值的抽象程度从高到低的顺序依次升高。3.根据权利要求2所述的方法,其特征在于,所述确定所述卷积神经网络模型包括的多个隐含层中每个隐含层的隐藏概率,包括:对于所述卷积神经网络模型包括的多个隐含层中的每个隐含层,获取所述隐含层的输出值;基于所述隐含层的输出值,确定所述隐含层的隐藏概率。4.根据权利要求3所述的方法,其特征在于,所述基于所述隐含层的输出值,确定所述隐含层的隐藏概率,包括:对所述隐含层的输出值进行奇异值分解,得到N个奇异值,所述N为大于1的正整数;计算所述N个奇异值的平方和,并计算所述N个奇异值的平方和与预设比例的乘积,得到目标平方和;将所述N个奇异值按照从大到小的顺序进行排序,得到排序结果;确定所述排序结果中的第M个奇异值,其中,所述排序结果中的前M个奇异值的平方和大于所述目标平方和,且所述排序结果中的前M-1个奇异值的平方和小于所述目标平方和,所述M为大于或等于1的正整数;将所述M和所述N的比值确定为所述隐含层的隐藏概率。5.根据权利要求2所述的方法,其特征在于,所述确定所述卷积神经网络模型包括的多个隐含层中每个隐含层的隐藏概率,包括:获取第一隐含层的输出值以及第二隐含层的输出值,所述第一隐含层为所述多个隐含层中输出值抽象程度最低的隐含层,所述第二隐含层为所述多个隐含层中输出值抽象程度最高的隐含层;基于所述第一隐含层的输出值,确定所述第一隐含层的隐藏概率,基于所述第二隐含层的输出值,确定所述第二隐含层的隐藏概率;基于所述第一隐含层的隐藏概率和所述第二隐含层的隐藏概率之间的概率差值,确定所述多个隐含层中除所述第一隐含层和所述第二隐含层之外的其他隐含层的隐藏概率。6.根据权利要求5所述的方法,其特征在于,所述第一隐含层为与输入层连接的第一个隐含层,所述第二隐含层为与输出层连接的最后一个隐含层;所述基于所述第一隐含层的隐藏概率和所述第二隐含层的隐藏概率之间的概率差值,确定所述多个隐含层中除所述第一隐含层和所述第二隐含层之外的其他隐含层的隐藏概率,包括:基于所述多个隐含层的个数、所述概率差值、所述第一个隐含层的隐藏概率以及所述最后一个隐含层的隐藏概率,确定位于所述第一个隐含层和所述最后一个隐含层之间的每个隐含层的隐藏概率。7.根据权利要求1-6任一所述的方法,其特征在于,所述基于所述隐含层的隐藏概率从所述隐含层包括的多个节点中选择目标节点,包括:对于所述隐含层包括的多个节点中的每个节点,按照预设规则为所述节点生成一个随机概率;当所述随机概率小于所述隐藏概率时,将所述节点确定为目标节点。8.一种训练卷积神经网络模型的装置,其特征在于,...
【专利技术属性】
技术研发人员:万韶华,
申请(专利权)人:北京小米移动软件有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。