模型训练方法、装置、终端设备及存储介质制造方法及图纸

技术编号：27315339 阅读：20 留言：0更新日期：2021-02-10 09:46

本申请适用于人工智能技术领域，提供了一种模型训练方法、装置、终端设备及存储介质，该方法包括：目标模型对样本数据进行分类预测得到分类预测结果；根据分类预测结果分别计算不同样本数据的不确定度；若不确定度大于预设值，则将不确定度对应的样本数据设置为待标注样本，对待标注样本进行标注，根据标注后的待标注样本对目标模型进行模型训练直至目标模型收敛。本申请通过将不确定度大于预设值的样本数据设置为待标注样本，并根据获取到的标注信息对待标注样本进行标注，能准确的标注到样本数据中的有效样本，防止对冗余样本的标注，降低了对样本数据进行样本标注的时间成本和人力成本，提高了模型训练效率。此外，本申请还涉及区块链技术。涉及区块链技术。涉及区块链技术。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置、终端设备及存储介质

[0001]本申请涉及人工智能
，尤其涉及一种模型训练方法、装置、终端设备及存储介质。

技术介绍

[0002]训练模型是人工智能领域中不可或缺的一个环节，模型根据样本数据以及对应的标签调整模型的参数，从而学习到样本数据与标签的内在联系。而对于一个分类任务而言，模型学习到的是样本数据的类别边界。
[0003]现有的模型训练过程中，样本数据是随机选择的，或者称之为随机采样，模型训练过程中，有些样本数据包含的信息比较多，对于确定类别边界的帮助更大，相对的有些样本数据所包含的信息比较少或者说比较冗余，对于确定类别边界的帮助较少，使用随机采样的方法隐含了对冗余样本的需求，增加了标注样本数据的时间成本以及人力成本，进而导致模型训练效率低下。

技术实现思路

[0004]有鉴于此，本申请实施例提供了一种模型训练方法、装置、终端设备及存储介质，以解决现有技术的模型训练过程中，由于采用随机采样进行模型训练，所导致的模型训练效率低下的问题。
[0005]本申请实施例的第一方面提供了一种模型训练方法，包括：
[0006]将样本池输入目标模型，并根据所述目标模型对所述样本池中的样本数据进行分类预测，得到分类预测结果，所述分类预测结果包括所述样本数据与不同预设分类之间的分类概率；
[0007]根据所述分类预测结果分别计算不同所述样本数据的不确定度，所述不确定度用于表征对应所述样本数据与所述预设分类之间的置信程度；
[0008]若所述不确定度大于...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：将样本池输入目标模型，并根据所述目标模型对所述样本池中的样本数据进行分类预测，得到分类预测结果，所述分类预测结果包括所述样本数据与不同预设分类之间的分类概率；根据所述分类预测结果分别计算不同所述样本数据的不确定度，所述不确定度用于表征对应所述样本数据与所述预设分类之间的置信程度；若所述不确定度大于预设值，则将所述不确定度对应的所述样本数据设置为待标注样本，并分别获取所述待标注样本的标注信息；根据所述标注信息对所述待标注样本进行标注，并根据标注后的所述待标注样本对所述目标模型进行模型训练，直至所述目标模型收敛。2.根据权利要求1所述的模型训练方法，其特征在于，所述根据所述目标模型对所述样本池中的样本数据进行分类预测，得到分类预测结果，包括：对所述样本数据进行样本预处理，并将样本预处理后的所述样本数据输入所述目标模型；控制所述目标模型中的卷积层对所述样本数据进行特征提取，得到样本特征，并控制所述目标模型中的全连接层对所述样本特征进行特征组合，得到组合特征；计算所述组合特征与不同所述预设分类对应的预设特征之间的相似度，得到所述分类预测结果。3.根据权利要求2所述的模型训练方法，其特征在于，所述对所述样本数据进行样本预处理，包括：获取所述样本数据的样本特征，并计算所述样本特征的特征均值和特征标准差；根据所述特征均值和所述特征标准差对所述样本特征进行标准化处理；所述根据所述特征均值和所述特征标准差对所述样本特征进行标准化处理所采用的计算公式为：zij＝(xij－xi)/si其中，zij是标准化处理后的所述样本特征，xij是标准化处理前的所述样本特征，xi是所述特征均值，si是所述特征标准差。4.根据权利要求2所述的模型训练方法，其特征在于，所述计算所述组合特征与不同所述预设分类对应的预设特征之间的相似度，得到所述分类预测结果，包括：分别获取所述组合特征和所述预设特征的特征向量，得到组合向量和预设向量；根据欧式距离公式分别计算所述组合向量与不同所述预设向量之间的距离，得到所述分类预测结果。5.根据权利要求1所述的模型训练方法，其特征在于，所述根据所述分类预测结果分别计算不同所述样本数据的不确定度所采用的计算公式为：uncertainty＝1-max(softmax(M(Sample
m
)))其中，unc...

【专利技术属性】
技术研发人员：李金汇，林加新，陈立，
申请(专利权)人：中国平安人寿保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人