模型训练方法及装置制造方法及图纸

技术编号：22689648 阅读：35 留言：0更新日期：2019-11-30 03:59

本发明专利技术提供了一种模型训练方法，包括：获取待训练的网络生成模型；对网络生成模型重复执行训练操作，直至执行训练操作的次数满足预设的训练次数，或网络生成模型的模型参数满足预设的训练条件，以得到训练完成的目标网络生成模型；该训练操作，包括：应用网络生成模型，生成初始神经网络；为初始神经网络分配分类权重；获取训练数据对已分配分类权重的初始神经网络进行训练，得到目标神经网络；对目标神经网络进行评价，得到网络评价值；基于网络评价值更新网络生成模型的模型参数。能够通过训练网络生成模型，使得网络生成模型生成的子网络有较好的网络结构，进而可以提高训练效率，使得训练好的网络生成模型生成的子网络能够具有好的分类效果。

Model training method and device

The invention provides a model training method, which includes: obtaining the network generation model to be trained; repeatedly performing the training operation on the network generation model until the number of times of performing the training operation meets the preset training times, or the model parameters of the network generation model meet the preset training conditions to obtain the target network generation model after the training; the training operation includes: Using the network generation model to generate the initial neural network; assigning the classification weight to the initial neural network; obtaining the training data to train the initial neural network assigned the classification weight to obtain the target neural network; evaluating the target neural network to obtain the network evaluation value; updating the model parameters of the network generation model based on the network evaluation value. By training the network generation model, the sub network generated by the network generation model has a better network structure, which can improve the training efficiency, so that the sub network generated by the trained network generation model can have a good classification effect.

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法及装置
本专利技术涉及人工智能领域，特别涉及一种模型训练方法及装置。
技术介绍
随着信息科技的发展，人工智能也越来越广泛的应用在人们生活的方方面面。人工智能的发展，能极大的提高人们的工作效率，给人们提供便捷的生活方式，在人工智能中，涉及到神经网络模型的构建时，往往会应用到人工智能平台。经本专利技术人研究发现，现有技术中，由于现有的人工智能平台的局限性，使得在应用人工智能平台的生成神经网络时，生成的神经网络模型的网络结构较差，且神经网络模型的权重初始化效果不好，进而导致生成的神经网络需要的训练工作量大，分类效果差。
技术实现思路
本专利技术所要解决的技术问题是提供一种模型训练方法，能够通过训练网络生成模型，使得网络生成模型生成的子网络有较好的网络结构，进而可以提高训练效率，使得训练好的网络生成模型生成的子网络能够具有好的分类效果。本专利技术还提供了一种模型训练装置，用以保证上述方法在实际中的实现及应用。一种模型训练方法，包括：获取待训练的网络生成模型；对所述网络生成模型重复执行训练操作，直至执行所述训练操作的次数满足预设的训练次数，或所述网络生成模型的模型参数满足预设的训练条件，以得到训练完成的目标网络生成模型；所述训练操作，包括：应用所述网络生成模型，生成初始神经网络；依据预设的规则为所述初始神经网络分配分类权重；获取预先存储的训练数据对已分配分类权重的所述初始神经网络进行训练，得到目标神经网络；对所述目标神经网络进行评价，得到所述目标神...

【技术保护点】
1.一种模型训练方法，其特征在于，包括：/n获取待训练的网络生成模型；/n对所述网络生成模型重复执行训练操作，直至执行所述训练操作的次数满足预设的训练次数，或所述网络生成模型的模型参数满足预设的训练条件，以得到训练完成的目标网络生成模型；/n所述训练操作，包括：应用所述网络生成模型，生成初始神经网络；依据预设的规则为所述初始神经网络分配分类权重；获取预先存储的训练数据对已分配分类权重的所述初始神经网络进行训练，得到目标神经网络；对所述目标神经网络进行评价，得到所述目标神经网络的网络评价值；基于所述网络评价值更新所述网络生成模型的模型参数。/n

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：
获取待训练的网络生成模型；
对所述网络生成模型重复执行训练操作，直至执行所述训练操作的次数满足预设的训练次数，或所述网络生成模型的模型参数满足预设的训练条件，以得到训练完成的目标网络生成模型；
所述训练操作，包括：应用所述网络生成模型，生成初始神经网络；依据预设的规则为所述初始神经网络分配分类权重；获取预先存储的训练数据对已分配分类权重的所述初始神经网络进行训练，得到目标神经网络；对所述目标神经网络进行评价，得到所述目标神经网络的网络评价值；基于所述网络评价值更新所述网络生成模型的模型参数。

2.根据权利要求1所述的方法，其特征在于，所述依据预设的规则为所述初始神经网络分配分类权重，包括：
确定所述初始神经网络模型分别与预先构建的神经网络集合中的各个历史神经网络的相似度；
按各个所述相似度由大至小的顺序，依次获取各个历史神经网络中与所述初始神经网络相匹配的权重值，直至已获取的权重值满足所述初始神经网络的需求条件；
将已获取的各个所述权重值分配至所述初始神经网络中。

3.根据权利要求2所述的方法，其特征在于，得到目标神经网络之后，还包括：
将所述目标神经网络存储至所述神经网络集合中。

4.根据权利要求1所述的方法，其特征在于，重复执行训练操作，直至所述网络生成模型的模型参数满足预先设置的训练条件，包括：
重复执行训练操作，并在每次所述执行训练操作时，依据当前已更新的模型参数和前一次执行训练操作得到的已更新的模型参数，得到模型参数变化量，若当前的模型参数变化量小于预设的变化量阈值，则确定所述网络生成模型的模型参数满足预先设置的训练条件。

5.根据权利要求1所述的方法，其特征在于，所述对所述目标神经网络进行评价，得到所述目标神经网络的网络评价值，包括：
获取测试数据集；
将所述测试数据集中包含的各个测试数据输入至所述目标神经网络模型中，以得到所述目标神经网络的预测准确率；
依据所述预测准确率确定所述目标神经网络的网络评价值。

...

【专利技术属性】
技术研发人员：张浩，
申请(专利权)人：广东浪潮大数据研究有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人