调参方法、装置及存储介质制造方法及图纸

技术编号：19344078 阅读：19 留言：0更新日期：2018-11-07 14:36

本发明专利技术公开了一种调参方法、装置及存储介质，所述方法包括：根据预设的迭代训练次数n，对超参数的取值进行卷积神经网络模型的迭代训练；确定所述超参数的取值在每次迭代训练中的超参数价值；将所述n次迭代训练得到的超参数价值中的最大超参数价值所对应的取值作为所述超参数的最优取值。本发明专利技术有效地提高卷积神经网络模型中最优超参数的决策速度。

Parameter adjusting method, device and storage medium

The invention discloses a parametric adjustment method, device and storage medium. The method includes: according to the preset number of iteration training n, the convolution neural network model is iteratively trained for the value of the super-parameter; the value of the value of the super-parameter in each iteration training is determined; and the value of the super-parameter in each iteration training is obtained by training the n iterations. The value of the maximum parameter in the super parameter value is the best value of the super parameter. The invention effectively improves the decision speed of the optimal super parameter in the convolution neural network model.

全部详细技术资料下载

【技术实现步骤摘要】
调参方法、装置及存储介质
本专利技术涉及神经网络
，特别是涉及一种调参方法、装置及存储介质。
技术介绍
深度学习源自神经网络，核心是特征学习，即通过组合低层特征形成更加抽象的高层特征，从而发现数据的分布特征。卷积神经网络模型是一种多层神经网络，卷积神经网络模型有两套参数，一类是基础参数，如卷积层或全连接层的权重和偏置，另一类则是超参数，如网络训练时的学习率、权重衰减系数、Dropout比例等，需要在模型训练之前设定。卷积神经网络模型的训练过程就是根据损失自动调整基础参数的过程，如果想要快速调出合适的基础参数，取得更高的性能准确率，就需要选择合适的超参数。超参数的选择有两种基本方法：人工调参和自动化调参。自动化调参即对超参数进行自适应调整，减少对卷积神经网络模型训练过程的人工干预，从而降低卷积神经网络模型训练难度。目前常见的自动化调参算法包括网格搜索和随机搜索。其中网格搜索的算法时间复杂度会随着超参数增多呈指数上升，只能适用于小规模神经网络且超参数较少的情况；随机搜索的算法需要多次迭代采样才有可能确定最优超参数，当采样次数不足时会漏掉最优超参数组合，因此，目前常见的自动调参方法中最优超参数的决策速度还有待提高。
技术实现思路
为了克服上述缺陷，本专利技术要解决的技术问题是提供一种调参方法、装置及存储介质，用以提高卷积神经网络模型中超参数最优取值的决策速度。为解决上述技术问题，本专利技术实施例中的一种调参方法，包括：根据预设的迭代训练次数n，对超参数的取值进行卷积神经网络模型的迭代训练；确定所述超参数的取值在每次迭代训练中的超参数价值；将所述n次迭代训练得到...

【技术保护点】
1.一种调参方法，其特征在于，所述方法包括：根据预设的迭代训练次数n，对超参数的取值进行卷积神经网络模型的迭代训练；确定所述超参数的取值在每次迭代训练中的超参数价值；将所述n次迭代训练得到的超参数价值中的最大超参数价值所对应的取值作为所述超参数的最优取值。

【技术特征摘要】
1.一种调参方法，其特征在于，所述方法包括：根据预设的迭代训练次数n，对超参数的取值进行卷积神经网络模型的迭代训练；确定所述超参数的取值在每次迭代训练中的超参数价值；将所述n次迭代训练得到的超参数价值中的最大超参数价值所对应的取值作为所述超参数的最优取值。2.如权利要求1所述的方法，其特征在于，所述根据预设的迭代训练次数n，对超参数取值进行卷积神经网络模型的迭代训练，包括：对于第i次迭代训练，当所述i等于1时，将第一次随机采样的采样值作为所述超参数的取值，进行所述卷积神经网络模型的第一次迭代训练；当所述i大于1且小于所述n时，将第i次随机采样的采样值或预先确定的最优经验采样值作为所述超参数的取值，进行所述卷积神经网络模型的第i次迭代训练。3.如权利要求2所述的方法，其特征在于，其中将第i次随机采样的采样值或预先确定的最优经验采样值作为所述超参数的取值，进行所述卷积神经网络模型的第i次迭代训练之前，包括：将前i-1次迭代训练得到的超参数价值中的最大超参数价值所对应的取值确定为所述最优经验采样值。4.如权利要求2所述的方法，其特征在于，所述将第i次随机采样的采样值或预先确定的最优经验采样值作为所述超参数取值，进行所述卷积神经网络模型的第i次迭代训练之前，包括：根据预设的第一选取概率，将所述第i次随机采样的采样值作为所述超参数取值；根据预设的第二选取概率，将所述最优经验采样值作为所述超参数取值。5.如权利要求1-4中任意一项所述的方法，其特征在于，所述确定所述超参数的取值在每次迭代训练中的超参数价值，包括：对于任意一次迭代训练，在所述任意一次迭代训练结束...

【专利技术属性】
技术研发人员：徐茜，屠要峰，高洪，陈小强，李忠良，
申请(专利权)人：南京中兴软件有限责任公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人