【技术实现步骤摘要】
机器学习模型的训练方法及装置、样本处理方法及装置
本说明书一个或多个实施例涉及计算机
,尤其涉及一种机器学习模型的训练方法及装置,以及一种样本处理方法及装置。
技术介绍
随着机器学习的兴起,许多领域尝试训练机器学习模型,以完成特定任务。比如说,在图片处理领域,通过训练图片识别模型,来识别图片中包含的目标对象。又比如说,在客服领域,通过训练标问预测模型,来确定用户会话对应的标准问题。目前,对于训练得到的机器学习模型,其预测性能很大程度上依赖训练样本的质量和数量。通常,训练样本的质量越高、数量越多,训练所得模型的预测性能越优。然而,实际出于多种原因,获取足够数量的高质量训练样本十分困难,并且获取的训练样本中或多或少存在标注不准确或错误的样本。因此,迫切需要一种合理、可靠的方案,可以利用存在低质量训练样本的训练样本集,训练出性能较优的机器学习模型。
技术实现思路
本说明书一个或多个实施例描述了一种机器学习模型的训练方法及装置,相较于直接利用原始样本集训练机器学习模型,通过对原始样本集中的样 ...
【技术保护点】
1.一种机器学习模型的训练方法,包括:/n获取原始样本集和用于执行相同任务的多个预测模型;/n基于所述原始样本集,对所述多个预测模型进行多轮训练,得到多个训练后模型;其中,所述多轮训练中的任一轮训练具体包括:/n对所述原始样本集进行采样,得到若干原始样本,其中包括任意的第一原始样本,所述第一原始样本中包括第一样本特征和第一样本标签;/n将所述第一样本特征分别输入所述多个预测模型中,得到多个第一预测结果;/n至少基于所述多个第一预测结果和所述第一样本标签,确定出现频次最高的第一最高频结果;/n在所述第一最高频结果唯一的情况下,利用所述第一最高频结果对所述第一样本标签进行修正, ...
【技术特征摘要】
1.一种机器学习模型的训练方法,包括:
获取原始样本集和用于执行相同任务的多个预测模型;
基于所述原始样本集,对所述多个预测模型进行多轮训练,得到多个训练后模型;其中,所述多轮训练中的任一轮训练具体包括:
对所述原始样本集进行采样,得到若干原始样本,其中包括任意的第一原始样本,所述第一原始样本中包括第一样本特征和第一样本标签;
将所述第一样本特征分别输入所述多个预测模型中,得到多个第一预测结果;
至少基于所述多个第一预测结果和所述第一样本标签,确定出现频次最高的第一最高频结果;
在所述第一最高频结果唯一的情况下,利用所述第一最高频结果对所述第一样本标签进行修正,得到第一修正样本;
利用根据所述若干原始样本得到的若干修正样本,分别训练所述多个预测模型。
2.根据权利要求1所述的方法,其中,
所述原始样本集为图片样本集,所述相同任务为图片处理任务,所述多个预测模型为多个图片处理模型;或,
所述原始样本集为文本样本集,所述相同任务为文本处理任务,所述多个预测模型为多个文本处理模型;或,
所述原始样本集为音频样本集,所述相同任务为音频处理任务,所述多个预测模型为多个音频处理模型。
3.根据权利要求1所述的方法,其中,所述第一原始样本为客服场景下的第一用户会话样本,所述第一样本特征包括第一用户会话特征,所述第一样本标签指示第一用户标准问题,所述相同任务为确定用户会话对应的标准问题,所述多个预测模型为多个标问预测模型。
4.根据权利要求1所述的方法,其中,获取的多个预测模型为N个预训练模型,所述N个预训练模型基于以下步骤而得到:
将所述将原始样本集分割为N个样本集,其中包括第i个样本集;
获取参数初始化的N个初始模型,其中包括第i个初始模型;
利用所述第i个样本集训练所述第i个初始模型,得到第i个预训练模型,归入所述N个预训练模型;
其中,i和N为正整数,并且N≥2,i≤N。
5.根据权利要求4所述的方法,其中,所述N个初始模型对应N套初始化模型参数,所述N套初始化模型参数中任意的两套模型参数不完全相同。
6.根据权利要求5所述的方法,其中,获取参数初始化的N个初始模型,包括:
设定互不相同的N个随机种子;
基于随机算法,利用所述N个随机种子对应生成N套随机数,作为所述N套初始化模型参数。
7.根据权利要求1所述的方法,其中,所述若干原始样本为多个原始样本,其中至少基于所述多个第一预测结果和所述第一样本标签,确定出现频次最高的第一最高频结果,包括:
确定所述多个原始样本中与所述第一原始样本具有相同样本特征的若干其他样本,所述若干其他样本中对应包括若干其他标签;
基于所述多个第一预测结果、所述第一样本标签和所述若干其他标签,确定所述第一最高频结果。
8.根据权利要求1所述的方法,其中,在确定出现频次最高的第一最高频结果之后,以及在分别训练所述多个预测模型之前,所述方法还包括:
在所述第一最高频结果不唯一的情况下,舍弃所述第一原始样本。
9.根据权利要求1所述的方法,其中,在得到多个训练后模型之后,所述方法还包括:
利用测试样本集,分别对所述多个训练后模型进行性能测试;
基于所述性能测试的结果,从所述多个训练后模型中选取性能最优的训练后模型作为针对所述相同任务的最终使用模型。
10.一种样本处理方法,包括:
获取原始样本集,其中包括任意的第一原始样本,所述第一原始样本中包括第一样本特征和第一样本标签;
获取用于执行相同任务的多个预测模型;
将所述第一样本特征分别输入所述多个预测模型中,得到多个第一预测结果;
至少基于所述多个第一预测结果和所述第一样本标签,确定出现频次最高的第一最高频结果;
在所述第一最高频结果唯一的情况下,利用所述第一最高频结果对所述第一原始样本中的第一样本标签进行修正,得到第一修正样本。
11.根据权利要求10所述的方法,其中,
所述第一原始样本为图片样本,所述相同任务为图片处理任务,所述多个预测模型为多个图片处理模型;或,
所述第一原始样本为文本样本,所述相同任务为文本处理任务,所述多个预测模型为多个文本处理模型;或,
所述第一原始样本为音频样本,所述相同任务为音频处理任务,所述多个预测模型为多个音频处理模型。
12.根据权利要求10所述的方法,其中,在确定出现频次最高的第一最高频结果之后,所述方法还包括:
在所述第一最高频结果为多个的情况下,舍弃所述第一原始样本。
13.一种机器学习模型的训练装置,包括:
获取单元,...
【专利技术属性】
技术研发人员:张望舒,温祖杰,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。