控制在线模型更新的方法及装置制造方法及图纸

技术编号：19935166 阅读：17 留言：0更新日期：2018-12-29 04:53

本说明书实施例提供一种控制线上模型更新的方法和装置，方法包括，从输入到线上第一模型的线上输入样本中采集第一数目的样本，用以进行人工标注；获取人工标注的第一数目的样本，作为训练样本；然后，至少基于所述训练样本，离线训练第一模型，得到第二模型。接着，利用预定测试样本集，离线测试所述第二模型；在测试结果满足预定条件的情况下，将线上运行的所述第一模型更新为第二模型。

全部详细技术资料下载

【技术实现步骤摘要】
控制在线模型更新的方法及装置
本说明书一个或多个实施例涉及模型训练和模型测试领域，尤其涉及更新在线模型的方法和装置。
技术介绍
随着人工智能的发展，已经针对各种各样的业务场景进行建模和机器学习，因此各种各样的神经网络模型被运用在丰富的业务场景中。例如，在车辆定损场景中，已经提出了多种模型，例如用于识别车辆部件的模型，用于识别车辆损失程度的模型，用于计算定损理赔方案的模型，等等。这些模型需要利用大量训练样本进行训练，然后用测试样本进行测试，测试通过之后，投入线上运行。然而，在有些情况下，即使训练和测试通过的模型，仍然需要对其进行更新，以进一步提高其准确度。因此，希望能有改进的方案，更加有效地对在线运行的模型进行更新。
技术实现思路
本说明书一个或多个实施例描述了一种控制线上模型更新的方法，可以对线上运行的模型进行自动高效的监控和更新。根据第一方面，提供了一种控制线上模型更新的方法，包括：从线上输入样本中采集第一数目的样本，用以进行人工标注，所述线上输入样本用于输入到线上运行的第一模型；获取人工标注的所述第一数目的样本，作为训练样本；至少基于所述训练样本，离线训练所述第一模型，得到第二模型；利用预定测试样本集，离线测试所述第二模型；在测试结果满足预定条件的情况下，将线上运行的所述第一模型更新为第二模型。根据一种可能的设计，上述方法还包括：评估所述线上运行的第一模型的预测准确度。进一步地，在一个实施例中，通过以下方式评估所述线上运行的第一模型的预测准确度：从所述线上输入样本中采集第二数目的样本，用以进行人工标注；获取人工标注的所述第二数目的样本，作为第一测试样本集；...

【技术保护点】
1.一种控制线上模型更新的方法，包括：从线上输入样本中采集第一数目的样本，用以进行人工标注，所述线上输入样本用于输入到线上运行的第一模型；获取人工标注的所述第一数目的样本，作为训练样本；至少基于所述训练样本，离线训练所述第一模型，得到第二模型；利用预定测试样本集，离线测试所述第二模型；在测试结果满足预定条件的情况下，将线上运行的所述第一模型更新为第二模型。

【技术特征摘要】
1.一种控制线上模型更新的方法，包括：从线上输入样本中采集第一数目的样本，用以进行人工标注，所述线上输入样本用于输入到线上运行的第一模型；获取人工标注的所述第一数目的样本，作为训练样本；至少基于所述训练样本，离线训练所述第一模型，得到第二模型；利用预定测试样本集，离线测试所述第二模型；在测试结果满足预定条件的情况下，将线上运行的所述第一模型更新为第二模型。2.根据权利要求1所述的方法，还包括：评估所述线上运行的第一模型的预测准确度。3.根据权利要求2所述的方法，其中评估所述线上运行的第一模型的预测准确度包括：从所述线上输入样本中采集第二数目的样本，用以进行人工标注；获取人工标注的所述第二数目的样本，作为第一测试样本集；利用所述第一测试样本集，测试所述线上运行的第一模型的预测准确度。4.根据权利要求3所述的方法，利用所述第一测试样本集，测试所述线上运行的第一模型的预测准确度，包括：获取所述线上运行的第一模型对所述第二数目的样本的预测结果；获取所述第二数目的样本的人工标注标签；通过比对所述预测结果和所述人工标注标签，确定所述线上运行的第一模型的预测准确度。5.根据权利要求3所述的方法，还包括，在将线上运行的所述第一模型更新为第二模型之后，评估线上运行的第二模型的预测准确度。6.根据权利要求5所述的方法，其中，评估线上运行的第二模型的预测准确度包括：利用所述第一测试样本集，测试所述线上运行的第二模型的预测准确度。7.根据权利要求5所述的方法，其中，评估线上运行的第二模型的预测准确度包括：从输入到第二模型的线上输入样本中采集第三数目的样本，用以进行人工标注；获取人工标注的所述第三数目的样本，作为第二测试样本集；利用所述第二测试样本集，测试所述线上运行的第二模型的预测准确度。8.根据权利要求1所述的方法，其中，至少基于所述训练样本，离线训练所述第一模型包括：将所述训练样本添加到原训练样本集中，得到更新的训练样本集；利用所述更新的训练样本集，离线训练所述第一模型。9.根据权利要求1所述的方法，其中，至少基于所述训练样本，离线训练所述第一模型包括：响应于所述第一数目达到预设阈值，离线训练所述第一模型；或者，每隔预定时间间隔，离线训练所述第一模型。10.根据权利要求2所述的方法，其中，至少基于所述训练样本，离线训练所述第一模型包括：在所述第一模型的预测准确度低于预设的第一准确度阈值的情况下，离线训练所述第一模型。11.根据权利要求1所述的方法，其中，所述预定测试样本集包括多个测试子集；所述离线测试所述第二模型包括，按照测试子集中样本数目从少到多的顺序，依次利用所述多个测试子集，测试所述第二模型的准确度，得到多个测试准确度。12.根据权利要求11所述的方法，所述测试结果满足预定条件包括，所述多个测试准确度均高于预设的第二准确度阈值。13.一种更新线上模型的装置，包括：样本采集单元，配置为从线上输入样本...

【专利技术属性】
技术研发人员：蒋晨，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人