This application discloses a method and device for verifying the training method of convolutional neural network. When training the neural network, the activation calculation in forward calculation is improved. If the input data of activation calculation in traditional technology is less than 0, the input data is modified to 1/10 of the input data, and the input data of activation calculation is improved to be less than 0. Value, then the input data is modified to 1/2 of the input data
【技术实现步骤摘要】
一种卷积神经网络的训练方法、验证方法及装置
本申请涉及深度学习领域,特别是涉及一种卷积神经网络的训练方法。验证方法及装置。
技术介绍
目前,深度学习在图像检测、语音识别等领域的应用越来越广泛,卷积神经网络是深度学习的一种重要算法。由于卷积神经网络的计算量比较大,因此相对来讲计算效率比较低。而卷积神经网络的计算效率在一定程度上限制了其在一些场景例如手机等终端设备中的应用。因此,如何提升卷积神经网络的计算效率,是目前急需解决的问题。
技术实现思路
本申请所要解决的技术问题是如何提升卷积神经网络的计算效率,提供一种卷积神经网络的训练方法、验证方法及装置。第一方面,本申请实施例提供了一种卷积神经网络的训练方法,所述方法包括:第一步:初始化神经网络的各个卷积核参数的初始值;第二步:按照所述神经网络的结构进行前向计算;其中,所述前向计算中的激活计算具体为:若所述激活计算的输入数据为小于0的值,则将所述输入数据修改为所述输入数据的1/2n,其中n为正整数;若所述激活计算的输入数据为大于或者等于0的值,则保持所述输入数据的值不变;第三步:判断所述神经网络的损失函数是否达到给定阈值,或者,所述神经网络的训练次数是否达到预设次数,如果是则执行第七步;反之执行第四步;第四步:按照所述神经网络的神经网络结构进行反向传播计算;第五步:按照所述神经网络的神经网络结构更新所述神经网络的卷积核参数的权重;第六步:返回执行所述第二步进行训练;第七步:保存所述神经网络对应的网络结构以及训练得到的神经网络模型。可选的,所述n=3或者,所述n=4。第二方面,本申请实施例提供了一种卷积神经网络的验证方 ...
【技术保护点】
1.一种卷积神经网络的训练方法,其特征在于,所述方法包括:第一步:初始化神经网络的各个卷积核参数的初始值;第二步:按照所述神经网络的结构进行前向计算;其中,所述前向计算中的激活计算具体为:若所述激活计算的输入数据为小于0的值,则将所述输入数据修改为所述输入数据的1/2n,其中n为正整数;若所述激活计算的输入数据为大于或者等于0的值,则保持所述输入数据的值不变;第三步:判断所述神经网络的损失函数是否达到给定阈值,或者,所述神经网络的训练次数是否达到预设次数,如果是则执行第七步;反之执行第四步;第四步:按照所述神经网络的神经网络结构进行反向传播计算;第五步:按照所述神经网络的神经网络结构更新所述神经网络的卷积核参数的权重;第六步:返回执行所述第二步进行训练;第七步:保存所述神经网络对应的网络结构以及训练得到的神经网络模型。
【技术特征摘要】
1.一种卷积神经网络的训练方法,其特征在于,所述方法包括:第一步:初始化神经网络的各个卷积核参数的初始值;第二步:按照所述神经网络的结构进行前向计算;其中,所述前向计算中的激活计算具体为:若所述激活计算的输入数据为小于0的值,则将所述输入数据修改为所述输入数据的1/2n,其中n为正整数;若所述激活计算的输入数据为大于或者等于0的值,则保持所述输入数据的值不变;第三步:判断所述神经网络的损失函数是否达到给定阈值,或者,所述神经网络的训练次数是否达到预设次数,如果是则执行第七步;反之执行第四步;第四步:按照所述神经网络的神经网络结构进行反向传播计算;第五步:按照所述神经网络的神经网络结构更新所述神经网络的卷积核参数的权重;第六步:返回执行所述第二步进行训练;第七步:保存所述神经网络对应的网络结构以及训练得到的神经网络模型。2.根据权利要求1所述的方法,其特征在于,所述n=3或者,所述n=4。3.一种卷积神经网络的验证方法,其特征在于,应用于ARM处理器,所述方法包括:获取目标输入数据;将所述目标输入数据作为神经网络模型的输入,计算得到所述卷积神经网络的输出结果;其中,所述神经网络模型为利用如权利要求1-2任意一项的方法训练得到的。4.根据权利要求3所述的方法,其特征在于,在计算得到所述卷积神经网络的输出结果的过程中,包括激活计算;所述激活计算具体包括:利用ARM处理器的单指令、多数据扩展结构NEON的比较函数,确定所述激活计算的输入数据是否小于0;如果是,则将所述小于0的输入数据执行取反操作,并将取反之后得到的数据执行向左移位n位的操作;将执行所述向左移位n位的操作之后得到的数据执行取反操作。5.根据权利要求3所述的方法,其特征在于,在计算得到所述卷积神经网络的输出结果的过程中,包括最大池化;所述最大池化具体包括:利用ARM处理器的单指令、多数据扩展结构NEON的取最大值函数,确定所述池化的输入数据中的最大值。6.一种卷积神经网络的训练装置,其特征在于,...
【专利技术属性】
技术研发人员:贾书军,程帅,袁淮,刘威,胡骏,田欢,周玲武,
申请(专利权)人:东软睿驰汽车技术沈阳有限公司,
类型:发明
国别省市:辽宁,21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。