模型训练方法、装置、终端设备及存储介质制造方法及图纸

技术编号:27315339 阅读:20 留言:0更新日期:2021-02-10 09:46
本申请适用于人工智能技术领域,提供了一种模型训练方法、装置、终端设备及存储介质,该方法包括:目标模型对样本数据进行分类预测得到分类预测结果;根据分类预测结果分别计算不同样本数据的不确定度;若不确定度大于预设值,则将不确定度对应的样本数据设置为待标注样本,对待标注样本进行标注,根据标注后的待标注样本对目标模型进行模型训练直至目标模型收敛。本申请通过将不确定度大于预设值的样本数据设置为待标注样本,并根据获取到的标注信息对待标注样本进行标注,能准确的标注到样本数据中的有效样本,防止对冗余样本的标注,降低了对样本数据进行样本标注的时间成本和人力成本,提高了模型训练效率。此外,本申请还涉及区块链技术。涉及区块链技术。涉及区块链技术。

【技术实现步骤摘要】
模型训练方法、装置、终端设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种模型训练方法、装置、终端设备及存储介质。

技术介绍

[0002]训练模型是人工智能领域中不可或缺的一个环节,模型根据样本数据以及对应的标签调整模型的参数,从而学习到样本数据与标签的内在联系。而对于一个分类任务而言,模型学习到的是样本数据的类别边界。
[0003]现有的模型训练过程中,样本数据是随机选择的,或者称之为随机采样,模型训练过程中,有些样本数据包含的信息比较多,对于确定类别边界的帮助更大,相对的有些样本数据所包含的信息比较少或者说比较冗余,对于确定类别边界的帮助较少,使用随机采样的方法隐含了对冗余样本的需求,增加了标注样本数据的时间成本以及人力成本,进而导致模型训练效率低下。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种模型训练方法、装置、终端设备及存储介质,以解决现有技术的模型训练过程中,由于采用随机采样进行模型训练,所导致的模型训练效率低下的问题。
[0005]本申请实施例的第一方面提供了一种模型训练方法,包括:
[0006]将样本池输入目标模型,并根据所述目标模型对所述样本池中的样本数据进行分类预测,得到分类预测结果,所述分类预测结果包括所述样本数据与不同预设分类之间的分类概率;
[0007]根据所述分类预测结果分别计算不同所述样本数据的不确定度,所述不确定度用于表征对应所述样本数据与所述预设分类之间的置信程度;
[0008]若所述不确定度大于预设值,则将所述不确定度对应的所述样本数据设置为待标注样本,并分别获取所述待标注样本的标注信息;
[0009]根据所述标注信息对所述待标注样本进行标注,并根据标注后的所述待标注样本对所述目标模型进行模型训练,直至所述目标模型收敛。
[0010]进一步地,所述根据所述目标模型对所述样本池中的样本数据进行分类预测,得到分类预测结果,包括:
[0011]对所述样本数据进行样本预处理,并将样本预处理后的所述样本数据输入所述目标模型;
[0012]控制所述目标模型中的卷积层对所述样本数据进行特征提取,得到样本特征,并控制所述目标模型中的全连接层对所述样本特征进行特征组合,得到组合特征;
[0013]计算所述组合特征与不同所述预设分类对应的预设特征之间的相似度,得到所述分类预测结果。
[0014]进一步地,所述对所述样本数据进行样本预处理,包括:
[0015]获取所述样本数据的样本特征,并计算所述样本特征的特征均值和特征标准差;
[0016]根据所述特征均值和所述特征标准差对所述样本特征进行标准化处理;
[0017]所述根据所述特征均值和所述特征标准差对所述样本特征进行标准化处理所采用的计算公式为:
[0018]zij=(xij-xi)/si
[0019]其中,zij是标准化处理后的所述样本特征,xij是标准化处理前的所述样本特征,xi是所述特征均值,si是所述特征标准差。
[0020]进一步地,所述计算所述组合特征与不同所述预设分类对应的预设特征之间的相似度,得到所述分类预测结果,包括:
[0021]分别获取所述组合特征和所述预设特征的特征向量,得到组合向量和预设向量;
[0022]根据欧式距离公式分别计算所述组合向量与不同所述预设向量之间的距离,得到所述分类预测结果。
[0023]进一步地,所述根据所述分类预测结果分别计算不同所述样本数据的不确定度所采用的计算公式为:
[0024]uncertainty=1-max(softmax(M(Sample
m
)))
[0025]其中,uncertainty是第m个所述样本数据对应的所述不确定度,max(softmax(M(Sample
m
)))是第m个所述样本数据与不同所述预设分类之间的最大所述分类概率。
[0026]进一步地,所述根据样本标注后的所述样本数据对所述目标模型进行模型训练,包括:
[0027]根据标注后的所述待标注样本生成样本训练数据,并将所述样本训练数据输入所述目标模型进行模型训练;
[0028]若模型训练后的所述目标模型的模型损失值大于损失阈值,则分别计算所述样本训练数据中标注后的所述待标注样本的不确定度;
[0029]若标注后的所述待标注样本的不确定度小于或等于所述预设值,则在所述样本训练数据中删除标注后的所述待标注样本;
[0030]将删除标注后的所述待标注样本的所述样本训练数据输入所述目标模型进行模型训练,直至模型训练后的所述目标模型的模型损失值小于或等于所述损失阈值,停止所述目标模型的模型训练。
[0031]进一步地,所述根据所述目标模型对所述样本池中的样本数据进行分类预测,得到分类预测结果之后,还包括:
[0032]若所述不确定度小于或等于所述预设值,则在所述样本池中删除所述不确定度对应的所述样本数据。
[0033]本申请实施例的第二方面提供了一种模型训练装置,包括:
[0034]分类预测单元,用于将样本池输入目标模型,并根据所述目标模型对所述样本池中的样本数据进行分类预测,得到分类预测结果,所述分类预测结果包括所述样本数据与不同预设分类之间的分类概率;
[0035]不确定度计算单元,用于根据所述分类预测结果分别计算不同所述样本数据的不确定度,所述不确定度用于表征对应所述样本数据与所述预设分类之间的置信程度;
[0036]标注信息获取单元,用于若所述不确定度大于预设值,则将所述不确定度对应的所述样本数据设置为待标注样本,并分别获取所述待标注样本的标注信息;
[0037]模型训练单元,用于根据所述标注信息对所述待标注样本进行标注,并根据标注后的所述待标注样本对所述目标模型进行模型训练,直至所述目标模型收敛。
[0038]本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在终端设备上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方案提供的模型训练方法的各步骤。
[0039]本申请实施例的第四方面提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方案提供的模型训练方法的各步骤。
[0040]实施本申请实施例提供的一种模型训练方法、装置、终端设备及存储介质具有以下有益效果:
[0041]本申请实施例提供的一种模型训练方法,通过根据分类预测结果分别计算不同样本数据的不确定度,使得基于不确定度能有效的表征对应样本数据与预设分类之间的置信程度,由于当样本数据与预设分类之间的置信程度越高时,目标模型针对样本数据与预设分类之间的分类越准确,则样本数据针对目标模型的模型训练过程中确定类别边界的帮助越小,因此,基于不确定度能有效的识别到样本数据中的冗余样本,且通过将不确定度大于预设值的样本数据设置为待标注样本,并根据获取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:将样本池输入目标模型,并根据所述目标模型对所述样本池中的样本数据进行分类预测,得到分类预测结果,所述分类预测结果包括所述样本数据与不同预设分类之间的分类概率;根据所述分类预测结果分别计算不同所述样本数据的不确定度,所述不确定度用于表征对应所述样本数据与所述预设分类之间的置信程度;若所述不确定度大于预设值,则将所述不确定度对应的所述样本数据设置为待标注样本,并分别获取所述待标注样本的标注信息;根据所述标注信息对所述待标注样本进行标注,并根据标注后的所述待标注样本对所述目标模型进行模型训练,直至所述目标模型收敛。2.根据权利要求1所述的模型训练方法,其特征在于,所述根据所述目标模型对所述样本池中的样本数据进行分类预测,得到分类预测结果,包括:对所述样本数据进行样本预处理,并将样本预处理后的所述样本数据输入所述目标模型;控制所述目标模型中的卷积层对所述样本数据进行特征提取,得到样本特征,并控制所述目标模型中的全连接层对所述样本特征进行特征组合,得到组合特征;计算所述组合特征与不同所述预设分类对应的预设特征之间的相似度,得到所述分类预测结果。3.根据权利要求2所述的模型训练方法,其特征在于,所述对所述样本数据进行样本预处理,包括:获取所述样本数据的样本特征,并计算所述样本特征的特征均值和特征标准差;根据所述特征均值和所述特征标准差对所述样本特征进行标准化处理;所述根据所述特征均值和所述特征标准差对所述样本特征进行标准化处理所采用的计算公式为:zij=(xij-xi)/si其中,zij是标准化处理后的所述样本特征,xij是标准化处理前的所述样本特征,xi是所述特征均值,si是所述特征标准差。4.根据权利要求2所述的模型训练方法,其特征在于,所述计算所述组合特征与不同所述预设分类对应的预设特征之间的相似度,得到所述分类预测结果,包括:分别获取所述组合特征和所述预设特征的特征向量,得到组合向量和预设向量;根据欧式距离公式分别计算所述组合向量与不同所述预设向量之间的距离,得到所述分类预测结果。5.根据权利要求1所述的模型训练方法,其特征在于,所述根据所述分类预测结果分别计算不同所述样本数据的不确定度所采用的计算公式为:uncertainty=1-max(softmax(M(Sample
m
)))其中,unc...

【专利技术属性】
技术研发人员:李金汇林加新陈立
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1