计算机执行的机器学习模型的训练方法、装置及设备制造方法及图纸

技术编号:23150359 阅读:37 留言:0更新日期:2020-01-18 13:57
本说明书实施例提供一种计算机执行的机器学习模型的训练方法、装置及设备,在训练方法中,获取在当前时间段内的增量数据,作为训练样本集。基于训练样本集,对在上一时间段训练后的机器学习模型进行增量训练,得到初始机器学习模型。将测试样本集中的各测试样本输入初始机器学习模型,以得到测试结果。基于测试结果,确定初始机器学习模型的准确率。若准确率大于第一阈值,则将初始机器学习模型作为在当前时间段训练后的机器学习模型。若准确率不大于第一阈值,则将测试样本集中测试结果错误的测试样本加入训练样本集,得到更新后的训练样本集,并基于更新后的训练样本集,对初始机器学习模型进行训练,以得到在当前时间段训练后的机器学习模型。

Training method, device and equipment of machine learning model executed by computer

【技术实现步骤摘要】
计算机执行的机器学习模型的训练方法、装置及设备
本说明书一个或多个实施例涉及计算机
,尤其涉及一种计算机执行的机器学习模型的训练方法、装置及设备。
技术介绍
随着机器学习的普遍流行,各种机器学习模型越来越受到关注。对于机器学习模型,通常需要先基于训练数据(也称训练样本)对其进行训练,之后,利用训练后的机器学习模型执行某种预测,如,执行类别预测等。需要说明的是,为了确保训练后的机器学习模型的准确率,通常需要基于大量的训练数据对其进行训练,这就使得模型的训练过程通常比较复杂。由于模型的训练过程比较复杂,传统技术中,通常会在训练后的机器学习模型的预测能力退化后,才再次启动模型的训练过程。因此,基于这种方式训练的机器学习模型通常适用于数据相对稳定的场景。而对于随着时间的推移,数据不断发生变化的场景,模型的预测准确率通常会比较低。因此,需要提供一种机器学习模型的训练方法,以适应随着时间的推移,数据不断变化的场景。
技术实现思路
本说明书一个或多个实施例描述了一种计算机执行的机器学习模型的训练方法、装置及设备,可以本文档来自技高网...

【技术保护点】
1.一种计算机执行的机器学习模型的训练方法,包括:/n获取在当前时间段内的增量数据,作为训练样本集;/n基于所述训练样本集,对在上一时间段训练后的机器学习模型进行增量训练,得到当前时间段的初始机器学习模型;/n将测试样本集中的各测试样本输入所述初始机器学习模型,以得到所述各测试样本的测试结果;/n基于所述各测试样本的测试结果,确定所述初始机器学习模型的准确率;/n若所述准确率大于第一阈值,则将所述初始机器学习模型作为在当前时间段训练后的机器学习模型;/n若所述准确率不大于第一阈值,则将所述测试样本集中测试结果错误的测试样本加入所述训练样本集,以得到更新后的训练样本集,并基于更新后的训练样本集,...

【技术特征摘要】
1.一种计算机执行的机器学习模型的训练方法,包括:
获取在当前时间段内的增量数据,作为训练样本集;
基于所述训练样本集,对在上一时间段训练后的机器学习模型进行增量训练,得到当前时间段的初始机器学习模型;
将测试样本集中的各测试样本输入所述初始机器学习模型,以得到所述各测试样本的测试结果;
基于所述各测试样本的测试结果,确定所述初始机器学习模型的准确率;
若所述准确率大于第一阈值,则将所述初始机器学习模型作为在当前时间段训练后的机器学习模型;
若所述准确率不大于第一阈值,则将所述测试样本集中测试结果错误的测试样本加入所述训练样本集,以得到更新后的训练样本集,并基于更新后的训练样本集,对所述初始机器学习模型进行训练,以得到在当前时间段训练后的机器学习模型。


2.根据权利要求1所述的方法,还包括:
从所述训练样本集中选取预测误差低于第二阈值的第一训练样本;
将所述第一训练样本加入所述测试样本集,以得到更新后的测试样本集;
将更新后的测试样本集作为下一时间段的测试样本集。


3.根据权利要求2所述的方法,所述第一训练样本具有对应的标签值;所述第一训练样本的预测误差基于当前时间段训练后的机器学习模型针对所述第一训练样本的预测值和所述标签值确定。


4.根据权利要求1所述的方法,所述基于更新后的训练样本集,对所述初始机器学习模型进行训练,以得到在当前时间段训练后的机器学习模型,包括:
迭代地执行以下步骤,直至训练后的初始机器学习模型的准确率大于所述第一阈值:
基于更新后的训练样本集,对所述初始机器学习模型进行训练;
利用所述测试样本集,对训练后的初始机器学习模型进行测试;
判断训练后的初始机器学习模型的准确率是否大于所述第一阈值;
若不大于,则基于所述测试样本集中测试结果错误的测试样本,再次对所述更新后的训练样本集进行更新;
迭代结束后,将在最后一轮迭代过程中训练后的初始机器学习模型作为在当前时间段训练后的机器学习模型。


5.根据权利要求1-4任一项所述的方法,所述机器学习模型包括问答匹配模型;所述问答匹配模型用于基于用户的用户问句匹配对应的标准问句;所述训练样本集中的样本包括:用户问句和标签值,所述标签值指示用户问句对应的标准问句。


6.一种计算机执行的机器学习模型的训练装置,包括:
获取单元,用于获取在当前时间段内的增量数据,作为训练样本集;
训练单元,用于基于所述获取单元获取的所述训练样本集,对在上一时间段训练后的机器学习模型进行增量训练,得到当前时间段的初始机器学习模型;
输入单元,用于将测试样本集中的各测试样本输入所述训练单元训练得到的所述初始机器学习模型,以得到所述各测试样本的测试结果;
确定单元,用于基于所述各测试样本的测试结果,确定所述初始机器学习模型的准确率;
所述确定单元,还用于若所述准...

【专利技术属性】
技术研发人员:张望舒温祖杰
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1