模型训练方法及装置制造方法及图纸

技术编号:22689648 阅读:35 留言:0更新日期:2019-11-30 03:59
本发明专利技术提供了一种模型训练方法,包括:获取待训练的网络生成模型;对网络生成模型重复执行训练操作,直至执行训练操作的次数满足预设的训练次数,或网络生成模型的模型参数满足预设的训练条件,以得到训练完成的目标网络生成模型;该训练操作,包括:应用网络生成模型,生成初始神经网络;为初始神经网络分配分类权重;获取训练数据对已分配分类权重的初始神经网络进行训练,得到目标神经网络;对目标神经网络进行评价,得到网络评价值;基于网络评价值更新网络生成模型的模型参数。能够通过训练网络生成模型,使得网络生成模型生成的子网络有较好的网络结构,进而可以提高训练效率,使得训练好的网络生成模型生成的子网络能够具有好的分类效果。

Model training method and device

The invention provides a model training method, which includes: obtaining the network generation model to be trained; repeatedly performing the training operation on the network generation model until the number of times of performing the training operation meets the preset training times, or the model parameters of the network generation model meet the preset training conditions to obtain the target network generation model after the training; the training operation includes: Using the network generation model to generate the initial neural network; assigning the classification weight to the initial neural network; obtaining the training data to train the initial neural network assigned the classification weight to obtain the target neural network; evaluating the target neural network to obtain the network evaluation value; updating the model parameters of the network generation model based on the network evaluation value. By training the network generation model, the sub network generated by the network generation model has a better network structure, which can improve the training efficiency, so that the sub network generated by the trained network generation model can have a good classification effect.

【技术实现步骤摘要】
模型训练方法及装置
本专利技术涉及人工智能领域,特别涉及一种模型训练方法及装置。
技术介绍
随着信息科技的发展,人工智能也越来越广泛的应用在人们生活的方方面面。人工智能的发展,能极大的提高人们的工作效率,给人们提供便捷的生活方式,在人工智能中,涉及到神经网络模型的构建时,往往会应用到人工智能平台。经本专利技术人研究发现,现有技术中,由于现有的人工智能平台的局限性,使得在应用人工智能平台的生成神经网络时,生成的神经网络模型的网络结构较差,且神经网络模型的权重初始化效果不好,进而导致生成的神经网络需要的训练工作量大,分类效果差。
技术实现思路
本专利技术所要解决的技术问题是提供一种模型训练方法,能够通过训练网络生成模型,使得网络生成模型生成的子网络有较好的网络结构,进而可以提高训练效率,使得训练好的网络生成模型生成的子网络能够具有好的分类效果。本专利技术还提供了一种模型训练装置,用以保证上述方法在实际中的实现及应用。一种模型训练方法,包括:获取待训练的网络生成模型;对所述网络生成模型重复执行训练操作,直至执行所述训练操作的次数满足预设的训练次数,或所述网络生成模型的模型参数满足预设的训练条件,以得到训练完成的目标网络生成模型;所述训练操作,包括:应用所述网络生成模型,生成初始神经网络;依据预设的规则为所述初始神经网络分配分类权重;获取预先存储的训练数据对已分配分类权重的所述初始神经网络进行训练,得到目标神经网络;对所述目标神经网络进行评价,得到所述目标神经网络的网络评价值;基于所述网络评价值更新所述网络生成模型的模型参数。上述的方法,可选的,所述依据预设的规则为所述初始神经网络分配分类权重,包括:确定所述初始神经网络模型分别与预先构建的神经网络集合中的各个历史神经网络的相似度;按各个所述相似度由大至小的顺序,依次获取各个历史神经网络中与所述初始神经网络相匹配的权重值,直至已获取的权重值满足所述初始神经网络的需求条件;将已获取的各个所述权重值分配至所述初始神经网络中。上述的方法,可选的,得到目标神经网络之后,还包括:将所述目标神经网络存储至所述神经网络集合中。上述的方法,可选的,重复执行训练操作,直至所述网络生成模型的模型参数满足预先设置的训练条件,包括:重复执行训练操作,并在每次所述执行训练操作时,依据当前已更新的模型参数和前一次执行训练操作得到的已更新的模型参数,得到模型参数变化量,若当前的模型参数变化量小于预设的变化量阈值,则确定所述网络生成模型的模型参数满足预先设置的训练条件。上述的方法,可选的,所述对所述目标神经网络进行评价,得到所述目标神经网络的网络评价值,包括:获取测试数据集;将所述测试数据集中包含的各个测试数据输入至所述目标神经网络模型中,以得到所述目标神经网络的预测准确率;依据所述预测准确率确定所述目标神经网络的网络评价值。一种模型训练装置,包括:获取单元,用于获取待训练的网络生成模型;训练单元,用于对所述网络生成模型重复执行训练操作,直至执行所述训练操作的次数满足预设的训练次数,或所述网络生成模型的模型参数满足预设的训练条件,以得到训练完成的目标网络生成模型;所述训练操作,包括:应用所述网络生成模型,生成初始神经网络;依据预设的规则为所述初始神经网络分配分类权重;获取预先存储的训练数据对已分配分类权重的所述初始神经网络进行训练,得到目标神经网络;对所述目标神经网络进行评价,得到所述目标神经网络的网络评价值;基于所述网络评价值更新所述网络生成模型的模型参数。上述的装置,可选的,所述训练单元,包括:确定子单元,用于确定所述初始神经网络模型分别与预先构建的神经网络集合中的各个历史神经网络的相似度;第一获取子单元,用于按各个所述相似度由大至小的顺序,依次获取各个历史神经网络中与所述初始神经网络相匹配的权重值,直至已获取的权重值满足所述初始神经网络的需求条件;分配子单元,用于将已获取的各个所述权重值分配至所述初始神经网络中。上述的装置,可选的,所述训练单元,还包括:存储子单元,将所述目标神经网络存储至所述神经网络集合中。上述的装置,可选的,所述训练单元,包括:训练子单元,用于重复执行训练操作,并在每次所述执行训练操作时,依据当前已更新的模型参数和前一次执行训练操作得到的已更新的模型参数,得到模型参数变化量,若当前的模型参数变化量小于预设的变化量阈值,则确定所述网络生成模型的模型参数满足预先设置的训练条件。上述的装置,可选的,所述训练单元,包括:第二获取子单元,用于获取测试数据集;输入子单元,用于将所述测试数据集中包含的各个测试数据输入至所述目标神经网络模型中,以得到所述目标神经网络的预测准确率;确定子单元,用于依据所述预测准确率确定所述目标神经网络的网络评价值。与现有技术相比,本专利技术包括以下优点:本专利技术提供了一种模型训练方法,包括:获取待训练的网络生成模型;对所述网络生成模型重复执行训练操作,直至执行所述训练操作的次数满足预设的训练次数,或所述网络生成模型的模型参数满足预设的训练条件,以得到训练完成的目标网络生成模型;所述训练操作,包括:应用所述网络生成模型,生成初始神经网络;依据预设的规则为所述初始神经网络分配分类权重;获取预先存储的训练数据对已分配分类权重的所述初始神经网络进行训练,得到目标神经网络;对所述目标神经网络进行评价,得到所述目标神经网络的网络评价值;基于所述网络评价值更新所述网络生成模型的模型参数。应用本专利技术提供的方法,能够通过训练网络生成模型,使得网络生成模型生成的子网络有较好的网络结构,进而可以提高训练效率,使得训练好的网络生成模型生成的子网络能够具有好的分类效果。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的一种模型训练方法的方法流程图;图2为本专利技术提供的一种模型训练方法的又一方法流程图;图3为本专利技术提供的一种模型训练方法的又一方法流程图;图4为本专利技术提供的一种模型训练装置的结构示意图;图5为本专利技术提供的一种电子设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装本文档来自技高网...

【技术保护点】
1.一种模型训练方法,其特征在于,包括:/n获取待训练的网络生成模型;/n对所述网络生成模型重复执行训练操作,直至执行所述训练操作的次数满足预设的训练次数,或所述网络生成模型的模型参数满足预设的训练条件,以得到训练完成的目标网络生成模型;/n所述训练操作,包括:应用所述网络生成模型,生成初始神经网络;依据预设的规则为所述初始神经网络分配分类权重;获取预先存储的训练数据对已分配分类权重的所述初始神经网络进行训练,得到目标神经网络;对所述目标神经网络进行评价,得到所述目标神经网络的网络评价值;基于所述网络评价值更新所述网络生成模型的模型参数。/n

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:
获取待训练的网络生成模型;
对所述网络生成模型重复执行训练操作,直至执行所述训练操作的次数满足预设的训练次数,或所述网络生成模型的模型参数满足预设的训练条件,以得到训练完成的目标网络生成模型;
所述训练操作,包括:应用所述网络生成模型,生成初始神经网络;依据预设的规则为所述初始神经网络分配分类权重;获取预先存储的训练数据对已分配分类权重的所述初始神经网络进行训练,得到目标神经网络;对所述目标神经网络进行评价,得到所述目标神经网络的网络评价值;基于所述网络评价值更新所述网络生成模型的模型参数。


2.根据权利要求1所述的方法,其特征在于,所述依据预设的规则为所述初始神经网络分配分类权重,包括:
确定所述初始神经网络模型分别与预先构建的神经网络集合中的各个历史神经网络的相似度;
按各个所述相似度由大至小的顺序,依次获取各个历史神经网络中与所述初始神经网络相匹配的权重值,直至已获取的权重值满足所述初始神经网络的需求条件;
将已获取的各个所述权重值分配至所述初始神经网络中。


3.根据权利要求2所述的方法,其特征在于,得到目标神经网络之后,还包括:
将所述目标神经网络存储至所述神经网络集合中。


4.根据权利要求1所述的方法,其特征在于,重复执行训练操作,直至所述网络生成模型的模型参数满足预先设置的训练条件,包括:
重复执行训练操作,并在每次所述执行训练操作时,依据当前已更新的模型参数和前一次执行训练操作得到的已更新的模型参数,得到模型参数变化量,若当前的模型参数变化量小于预设的变化量阈值,则确定所述网络生成模型的模型参数满足预先设置的训练条件。


5.根据权利要求1所述的方法,其特征在于,所述对所述目标神经网络进行评价,得到所述目标神经网络的网络评价值,包括:
获取测试数据集;
将所述测试数据集中包含的各个测试数据输入至所述目标神经网络模型中,以得到所述目标神经网络的预测准确率;
依据所述预测准确率确定所述目标神经网络的网络评价值。

...

【专利技术属性】
技术研发人员:张浩
申请(专利权)人:广东浪潮大数据研究有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1