一种神经网络的超参数处理的方法及装置制造方法及图纸

技术编号：20364565 阅读：18 留言：0更新日期：2019-02-16 17:17

一种神经网络的超参数处理的方法，包括：将用于进行模型训练的数据中的第一数据分为K等份，为模型生成一个超参数字典；每次训练时，对所述超参数字典中的参数的取值进行排列组合，针对每一种排列组合循环选取K‑1份的数据进行训练，剩余一份数据进行验证，记录K次模型验证的模型得分均值和训练时间的平均值；选择最优的模型得分均值及处于指定范围内的训练时间的平均值对应的参数组合，作为所述模型的超参数组合。还提供一种神经网络的超参数处理的装置。本方案可以将超参数这种手动设置，转变为依赖于经验的过程自动化，极大减轻了模型设计人员的工作量，提高了工作效率。同时通过更适合的超参数设置，提高模型训练的速度和模型的精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络的超参数处理的方法及装置
本专利技术涉及机器学习神经网络领域，尤指一种神经网络的超参数处理的方法及装置。
技术介绍
在机器学习和相关领域，神经网络(人工神经网络)的计算模型灵感来自动物的中枢神经系统(尤其是脑)，并且被用于估计或可以依赖于大量的输入和一般的未知近似函数。人工神经网络通常呈现为相互连接的“神经元”，它可以从输入的计算值，并且能够机器学习以及模式识别由于它们的自适应性质的系统。人工神经网络也具有初步的自适应与自组织能力。在学习或训练过程中改变突触权重值，以适应周围环境的要求。同一网络因学习方式及内容不同可具有不同的功能。人工神经网络是一个具有学习能力的系统，可以发展知识，以致超过设计者原有的知识水平。通常，它的学习训练方式可分为两种，一种是有监督或称有导师的学习，这时利用给定的样本标准进行分类或模仿；另一种是无监督学习或称无为导师学习，这时，只规定学习方式或某些规则，则具体的学习内容随系统所处环境(即输入信号情况)而异，系统可以自动发现环境特征和规律性，具有更近似人脑的功能。超参数是在开始学习过程之前设置值的参数，而不是通过训练得到的参数数据。通常情况下，在机器学习过程中需要对超参数进行优化，给学习器选择一组最优超参数，以提高学习的性能和效果。比如学习率，正则化参数，神经网络的层数，每一个隐藏层中神经元的个数，学习的回合数(Epoch)，批量数据的大小(minibatchsize)，神经元的激活函数，cost函数的选择等都是超参数。与超参数区别的概念是参数，它是模型训练过程中学习到的一部分，比如神经网络权重。参数是通过模型训练获得的...

【技术保护点】
1.一种神经网络的超参数处理的方法，其特征在于，包括：将用于进行模型训练的数据中的第一数据分为K等份，为模型生成一个超参数字典；每次训练时，对所述超参数字典中的参数的取值进行排列组合，针对每一种排列组合循环选取K‑1份的数据进行训练，剩余一份数据进行验证，记录K次模型验证的模型得分均值和训练时间的平均值；选择最优的模型得分均值及处于指定范围内的训练时间的平均值对应的参数组合，作为所述模型的超参数组合。

【技术特征摘要】
1.一种神经网络的超参数处理的方法，其特征在于，包括：将用于进行模型训练的数据中的第一数据分为K等份，为模型生成一个超参数字典；每次训练时，对所述超参数字典中的参数的取值进行排列组合，针对每一种排列组合循环选取K-1份的数据进行训练，剩余一份数据进行验证，记录K次模型验证的模型得分均值和训练时间的平均值；选择最优的模型得分均值及处于指定范围内的训练时间的平均值对应的参数组合，作为所述模型的超参数组合。2.根据权利要求1所述的方法，其特征在于，所述选择最优的模型得分均值及处于指定范围内的训练时间的平均值对应的参数组合，作为所述模型的超参数组合后，还包括：使用所选的超参数组合，应用所述用于进行模型训练的数据中除所述第一数据外的数据，进行模型评估。3.根据权利要求1或2所述的方法，其特征在于，所述超参数字典中的参数至少包括以下参数：学习率，学习的回合数，批量数据的大小。4.一种神经网络的超参数...

【专利技术属性】
技术研发人员：赵仁明，
申请(专利权)人：郑州云海信息技术有限公司，
类型：发明
国别省市：河南,41

全部详细技术资料下载我是这个专利的主人