【技术实现步骤摘要】
控制在线模型更新的方法及装置
本说明书一个或多个实施例涉及模型训练和模型测试领域,尤其涉及更新在线模型的方法和装置。
技术介绍
随着人工智能的发展,已经针对各种各样的业务场景进行建模和机器学习,因此各种各样的神经网络模型被运用在丰富的业务场景中。例如,在车辆定损场景中,已经提出了多种模型,例如用于识别车辆部件的模型,用于识别车辆损失程度的模型,用于计算定损理赔方案的模型,等等。这些模型需要利用大量训练样本进行训练,然后用测试样本进行测试,测试通过之后,投入线上运行。然而,在有些情况下,即使训练和测试通过的模型,仍然需要对其进行更新,以进一步提高其准确度。因此,希望能有改进的方案,更加有效地对在线运行的模型进行更新。
技术实现思路
本说明书一个或多个实施例描述了一种控制线上模型更新的方法,可以对线上运行的模型进行自动高效的监控和更新。根据第一方面,提供了一种控制线上模型更新的方法,包括:从线上输入样本中采集第一数目的样本,用以进行人工标注,所述线上输入样本用于输入到线上运行的第一模型;获取人工标注的所述第一数目的样本,作为训练样本;至少基于所述训练样本,离线训练所述第一模型,得到第二模型;利用预定测试样本集,离线测试所述第二模型;在测试结果满足预定条件的情况下,将线上运行的所述第一模型更新为第二模型。根据一种可能的设计,上述方法还包括:评估所述线上运行的第一模型的预测准确度。进一步地,在一个实施例中,通过以下方式评估所述线上运行的第一模型的预测准确度:从所述线上输入样本中采集第二数目的样本,用以进行人工标注;获取人工标注的所述第二数目的样本,作为第一测试样本集; ...
【技术保护点】
1.一种控制线上模型更新的方法,包括:从线上输入样本中采集第一数目的样本,用以进行人工标注,所述线上输入样本用于输入到线上运行的第一模型;获取人工标注的所述第一数目的样本,作为训练样本;至少基于所述训练样本,离线训练所述第一模型,得到第二模型;利用预定测试样本集,离线测试所述第二模型;在测试结果满足预定条件的情况下,将线上运行的所述第一模型更新为第二模型。
【技术特征摘要】
1.一种控制线上模型更新的方法,包括:从线上输入样本中采集第一数目的样本,用以进行人工标注,所述线上输入样本用于输入到线上运行的第一模型;获取人工标注的所述第一数目的样本,作为训练样本;至少基于所述训练样本,离线训练所述第一模型,得到第二模型;利用预定测试样本集,离线测试所述第二模型;在测试结果满足预定条件的情况下,将线上运行的所述第一模型更新为第二模型。2.根据权利要求1所述的方法,还包括:评估所述线上运行的第一模型的预测准确度。3.根据权利要求2所述的方法,其中评估所述线上运行的第一模型的预测准确度包括:从所述线上输入样本中采集第二数目的样本,用以进行人工标注;获取人工标注的所述第二数目的样本,作为第一测试样本集;利用所述第一测试样本集,测试所述线上运行的第一模型的预测准确度。4.根据权利要求3所述的方法,利用所述第一测试样本集,测试所述线上运行的第一模型的预测准确度,包括:获取所述线上运行的第一模型对所述第二数目的样本的预测结果;获取所述第二数目的样本的人工标注标签;通过比对所述预测结果和所述人工标注标签,确定所述线上运行的第一模型的预测准确度。5.根据权利要求3所述的方法,还包括,在将线上运行的所述第一模型更新为第二模型之后,评估线上运行的第二模型的预测准确度。6.根据权利要求5所述的方法,其中,评估线上运行的第二模型的预测准确度包括:利用所述第一测试样本集,测试所述线上运行的第二模型的预测准确度。7.根据权利要求5所述的方法,其中,评估线上运行的第二模型的预测准确度包括:从输入到第二模型的线上输入样本中采集第三数目的样本,用以进行人工标注;获取人工标注的所述第三数目的样本,作为第二测试样本集;利用所述第二测试样本集,测试所述线上运行的第二模型的预测准确度。8.根据权利要求1所述的方法,其中,至少基于所述训练样本,离线训练所述第一模型包括:将所述训练样本添加到原训练样本集中,得到更新的训练样本集;利用所述更新的训练样本集,离线训练所述第一模型。9.根据权利要求1所述的方法,其中,至少基于所述训练样本,离线训练所述第一模型包括:响应于所述第一数目达到预设阈值,离线训练所述第一模型;或者,每隔预定时间间隔,离线训练所述第一模型。10.根据权利要求2所述的方法,其中,至少基于所述训练样本,离线训练所述第一模型包括:在所述第一模型的预测准确度低于预设的第一准确度阈值的情况下,离线训练所述第一模型。11.根据权利要求1所述的方法,其中,所述预定测试样本集包括多个测试子集;所述离线测试所述第二模型包括,按照测试子集中样本数目从少到多的顺序,依次利用所述多个测试子集,测试所述第二模型的准确度,得到多个测试准确度。12.根据权利要求11所述的方法,所述测试结果满足预定条件包括,所述多个测试准确度均高于预设的第二准确度阈值。13.一种更新线上模型的装置,包括:样本采集单元,配置为从线上输入样本...
【专利技术属性】
技术研发人员:蒋晨,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。