【技术实现步骤摘要】
一种模型训练方法、装置、计算机存储介质及设备
[0001]本申请涉及机器学习
,尤其涉及一种模型训练方法、装置、计算机存储介质及设备。
技术介绍
[0002]目前,在利用机器学习解决预测或排序问题时,需要利用样本数据对神经网络模型进行训练,然后利用训练后的神经网络模型解决实际问题。然而,在相关技术中,样本数据是通过随机采样得到的,不同的样本数据并不会进行区分对待,所以神经网络模型很容易过拟合和欠拟合,导致训练后的神经网络模型的预测效果不好。
技术实现思路
[0003]本申请提供了一种模型训练方法、装置、计算机存储介质及设备,通过分层采样和模型融合来得到目标模型,从而可以提高目标模型的预测准确性和泛化能力。
[0004]本申请的技术方案是这样实现的:
[0005]第一方面,本申请实施例提供了一种模型训练方法,该方法包括:
[0006]获取至少两个样本数据集;其中,所述至少两个样本数据集各自包括的样本数据中难易比例不同;
[0007]通过所述至少两个样本数据集分别对至少两个预 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取至少两个样本数据集;其中,所述至少两个样本数据集各自包括的样本数据中难易比例不同;通过所述至少两个样本数据集分别对至少两个预设模型进行训练,得到至少两个训练模型;将所述至少两个训练模型进行模型融合,得到目标模型。2.根据权利要求1所述的模型训练方法,其特征在于,所述获取至少两个样本数据集,包括:获取多个样本数据,计算所述多个样本数据各自的数据评分;基于所述多个样本数据各自的数据评分,确定所述多个样本数据所属的训练难度类别;基于所述多个样本数据所属的训练难度类别对所述多个样本数据进行分层采样,确定所述至少两个样本数据集。3.根据权利要求2所述的模型训练方法,其特征在于,所述计算所述多个样本数据各自的数据评分,包括:将所述多个样本数据进行分组,得到N个待计算数据集;其中,N为大于或等于2的整数;从所述N个待计算数据集中,确定第一待计算数据集和第二待计算数据集;其中,所述第一待计算数据集是指所述N个待计算数据集的任意一个待计算数据集,所述第二待计算数据集包括所述N个待计算数据集中除第一待计算数据集之外的所有待计算数据集;利用所述第二待计算数据集对所述预设评分模型进行训练,得到目标评分模型;利用所述第一待计算数据集对所述目标评分模型进行模型测试,确定所述第一待计算数据集中每一样本数据各自的数据评分;在确定出所述N个待计算数据集中每一样本数据各自的数据评分后,得到所述多个样本数据各自的数据评分。4.根据权利要求3所述的模型训练方法,其特征在于,所述目标评分模型包括M个目标评分子模型;所述利用所述第二待计算数据集对所述预设评分模型进行训练,得到目标评分模型,包括:将所述第二待计算数据集进行分组,得到M个待计算数据子集;其中,M为大于或等于1的整数;利用所述M个待计算数据子集对所述预设评分模型进行训练,得到所述M个目标评分子模型。5.根据权利要求4所述的模型训练方法,其特征在于,所述利用所述第一待计算数据集对所述目标评分模型进行模型测试,确定所述第一待计算数据集中每一样本数据各自的数据评分,包括:将待测试样本数据输入到所述M个目标评分模型中,输出M个模型测试结果;其中,所述待测试样本数据是指所述第一待计算数据集中的任意一个样本数据;基于所述M个模型测试结果,确定所述待测试样本数据的数据评分。6.根据权利要求5所述的模型训练方法,其特征在于,所述基于所述M个模型测试结果,确定所述待测试样本数据的数据评分,包括:
从所述M个模型测试结果中确定最大值、最小值、中位值、平均值和标准差,以及确定所述待测试样本数据的真实标签值;计算所述平均值与所述真实标签值之间的差值绝对值,得到第一差值;计算所述中位值与所述真实标签值之间的差值绝对值,得到第二差值;计算所述最大值和所述最小值之间的差值,得到第三差值;对所述第一差值、所述第二差值、所述第三差值和所述标准差进行加权求和计算,得到所述待测试样本数据的数据评分。7.根据权利要求6所述的模型训练方法,其特征在于,所述训练难度类别包括简单类别、常规类别和困难类别;所述基于所述多个样本数据各自的数据评分,确定所述多个样本数据各自的训练难度类别,包括:确定第一评分阈值和第二评分阈值;其中,所述第一评分阈值小于所述第二评分阈值;若其中一个样本数据的数据评分小于所述第一评分阈值,则确定所述其中一个样本数据的训练难度类别为所述简单类别;若其中一个样本数据的数据评分大于或等于所述第一评分阈值,且小于所述第二评分阈值,则确定所述其中一个样本数据的训练难度类别为所述常规类别;若其中一个样本数据的数据评分大于或等于所述第二评分阈值,则确定所述其...
【专利技术属性】
技术研发人员:张琦,孙中伟,姬艳鑫,潘城城,刘永平,李静晓,黄一珉,张新,曹雨晨,张钧皓,张少洋,苏凯贤,刘鸿儒,
申请(专利权)人:北京京东世纪贸易有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。