模型更新方法及装置制造方法及图纸

技术编号:33325765 阅读:12 留言:0更新日期:2022-05-08 09:04
本申请公开了一种模型更新方法及装置,属于AI领域。所述方法包括:获取异常解释性信息,所述异常解释性信息为解释内容异常的解释性信息,所述解释性信息是用于解释机器学习模型的输出结果的信息;基于所述异常解释性信息,调整所述机器学习模型的训练样本集;获取更新后的机器学习模型,所述机器学习模型基于调整后的训练样本集训练得到。本申请能够提高更新后的机器学习模型的可靠性。后的机器学习模型的可靠性。后的机器学习模型的可靠性。

【技术实现步骤摘要】
模型更新方法及装置


[0001]本申请涉及人工智能(Artificial Intelligence,AI)领域,特别涉及一种模型更新方法及装置。

技术介绍

[0002]机器学习,是指让机器基于训练样本训练出机器学习模型,使机器学习模型对训练样本之外的数据具有预测能力(如类别预测能力)。机器学习作为AI领域的一个重要分支,在众多领域得到了广泛的应用。
[0003]随着环境或规则等的改变,原有的机器学习模型需要随时间进行更新。目前,机器学习模型的更新由人为经验触发或者周期性更新,更新灵活性较低,导致更新后的机器学习模型的可靠性较低。

技术实现思路

[0004]本申请实施例提供了一种模型更新方法及装置。该技术方案如下:
[0005]第一方面,提供了一种模型更新方法,该方法可以由计算机设备执行,该方法包括:
[0006]获取异常解释性信息,该异常解释性信息为解释内容异常的解释性信息,该解释性信息是用于解释机器学习模型的输出结果的信息;基于该异常解释性信息,调整该机器学习模型的训练样本集;获取更新后的机器学习模型,该机器学习模型基于调整后的训练样本集训练得到。
[0007]本申请实施例提供的模型更新方法,在获取异常解释性信息后,基于获取的异常解释性信息,调整该机器学习模型的训练样本集,从而采用该训练样本集获取更新后的机器学习模型。如此,实现基于异常解释性信息的模型的自动更新,有效提高模型更新的灵活性,从而提高更新后的机器学习模型的可靠性。
[0008]其中,该解释性信息包括一个或多个特征,以及该特征的特征值,该基于该异常解释性信息,调整该机器学习模型的训练样本集的过程,包括:将训练样本集中的目标训练样本对应的标签更新,得到调整后的训练样本集,其中,该目标训练样本包括与该异常解释性信息中的异常特征相同的目标特征,且该目标特征的特征值与该异常特征的异常特征值相同。
[0009]若训练样本集中某一训练样本的特征与异常特征相同,且该特征的特征值与异常特征值相同,则该训练样本的标签存在错误的概率较高。通过对训练样本集的标签进行更新,可以减少错误标签的产生概率,提高采用调整后的训练样本集训练得到机器学习模型的可靠性。
[0010]本申请实施例中,基于异常解释性信息,调整机器学习模型的训练样本集的方式有多种,下面以以下几种可选方式为例进行说明:
[0011]在第一种可选方式中,计算机设备基于异常解释性信息中的异常特征,调整机器
学习模型的训练样本集。该过程包括:将训练样本集中的目标训练样本对应的标签更新,得到调整后的训练样本集,其中,目标训练样本包括与异常解释性信息中的异常特征相同的目标特征,且目标特征的特征值与异常特征的异常特征值相同。
[0012]在第一种可选实现方式中,计算机设备将训练样本集中的所有目标训练样本对应的标签更新,得到调整后的训练样本集,其中,目标训练样本包括与异常解释性信息中的异常特征相同的目标特征,且目标特征的特征值与异常特征的异常特征值相同。
[0013]在第二种可选实现方式中,计算机设备将训练样本集中的目标训练样本对应的标签逐步更新,得到调整后的训练样本集,其中,目标训练样本包括与异常解释性信息中的异常特征相同的目标特征,且目标特征的特征值与异常特征的异常特征值相同,目标训练样本的判定过程参考前述第一种可选实现方式。计算机设备将训练样本集中的目标训练样本对应的标签逐步更新,得到调整后的训练样本集的过程包括:
[0014]获取初始的x值,1≤x<y,并基于初始的x值,执行至少两次重训练流程,直至达到预设截止条件,所述y为所述训练样本集中目标训练样本的总数;将该至少两次重训练流程得到的机器学习模型中的验证效果最优的机器学习模型所对应的训练样本集确定为该调整后的训练样本集;
[0015]其中,该重训练流程包括:将该训练样本集中x个目标训练样本对应的标签更新为相反的标签;基于标签更新后的训练样本集,训练该机器学习模型,得到重训练后的机器学习模型;增大x得到更新后的x,再次执行该重训练流程。
[0016]在一种可选实现方式中,在该获取异常解释性信息之前,模型更新方法还包括:在接收到该机器学习模型的输出结果后,基于该输出结果生成解释性信息;显示生成的解释性信息。通过显示解释性信息,可以便于用户基于该解释性信息了解得到输出结果的原因。
[0017]示例的,计算机设备可以在每次生成一个解释性信息后,显示该解释性信息。在一种可选示例中,计算机设备可以将对应同一输入信息的输出结果和解释性信息同时显示。
[0018]前述获取异常解释性信息的过程可以包括:接收该解释性信息的判定信息,该判定信息用于指示该解释性信息的解释内容是否异常;将判定信息指示解释内容异常的解释性信息确定为该异常解释性信息。示例的,该解释性信息包括一个或多个特征,以及该特征的特征值,该将判定信息指示解释内容异常的解释性信息确定为该异常解释性信息的过程,包括:当该判定信息指示该解释性信息中的任一特征为异常特征时,确定该解释性信息为异常解释性信息。
[0019]前述输出结果是该机器学习模型基于的输入信息生成的,在本申请实施例中,基于该输出结果生成解释性信息的过程可以包括:获取该输出结果对应的输入信息;在该训练样本集中确定与该输入信息距离小于预设距离阈值或者距离最近的目标样本;生成该解释性信息,该解释性信息包括该目标样本包括的特征以及特征值,以及预先获取的该目标样本中各个特征的权值。
[0020]由于输出结果是机器学习模型基于输入信息生成的,因此,解释性信息中可以包括输入信息或者输入信息的相关信息,以便于用户更为全面地了解输出结果。
[0021]在本申请实施例中,基于输出结果生成解释性信息的方式有多种,下面以以下两种可选实现方式为例进行说明:
[0022]在第一种可选实现方式中,计算机设备获取输出结果对应的输入信息;基于该输
入信息生成解释性信息,该解释性信息包括输入信息包括的特征以及特征值,以及输入信息中各个特征的权值(也称权重系数或者权重),该权值反映了对应特征对输出结果的贡献度。示例的,计算机设备可以采用解释性算法获取输入信息中各个特征的权值。该解释性算法可以为局部可解释性模型(Local Interpretable Model-Agnostic Explanation,LIME)算法。
[0023]在第二种可选实现方式中,计算机设备获取输出结果对应的输入信息;在训练样本集中确定与输入信息距离小于预设距离阈值或者距离最近的目标样本;生成解释性信息,该解释性信息包括目标样本包括的特征以及特征值,以及预先获取的目标样本中各个特征的权值,该权值反映了对应特征对目标样本的标签的贡献度。其中,目标样本中各个特征的权值是预先获取的指的是在生成解释性信息之前,该权值已经获取。如此,第二种可选方式所获取的解释性信息与第一种可选实现方式获取的解释性信息接近,但是由于第二种可选方式中的解释性信息中的权值是预先获取的,无需实时计算,因本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型更新方法,其特征在于,所述方法包括:获取异常解释性信息,所述异常解释性信息为解释内容异常的解释性信息,所述解释性信息是用于解释机器学习模型的输出结果的信息;基于所述异常解释性信息,调整所述机器学习模型的训练样本集;获取更新后的机器学习模型,所述机器学习模型基于调整后的训练样本集训练得到。2.根据权利要求1所述的方法,其特征在于,所述解释性信息包括一个或多个特征,以及所述特征的特征值,所述基于所述异常解释性信息,调整所述机器学习模型的训练样本集,包括:将训练样本集中的目标训练样本对应的标签更新,得到调整后的训练样本集,其中,所述目标训练样本包括与所述异常解释性信息中的异常特征相同的目标特征,且所述目标特征的特征值与所述异常特征的异常特征值相同。3.根据权利要求2所述的方法,其特征在于,所述将训练样本集中的目标训练样本对应的标签更新,得到调整后的训练样本集,包括:获取初始的x值,1≤x<y,并基于初始的x值,执行至少两次重训练流程,直至达到预设截止条件,所述y为所述训练样本集中目标训练样本的总数;将所述至少两次重训练流程得到的机器学习模型中的验证效果最优的机器学习模型所对应的训练样本集确定为所述调整后的训练样本集;其中,所述重训练流程包括:将所述训练样本集中x个目标训练样本对应的标签更新为相反的标签;基于标签更新后的训练样本集,训练所述机器学习模型,得到重训练后的机器学习模型;增大x得到更新后的x,再次执行所述重训练流程。4.根据权利要求1至3任一所述的方法,其特征在于,在所述获取异常解释性信息之前,所述方法还包括:在接收到所述机器学习模型的输出结果后,基于所述输出结果生成解释性信息;显示生成的解释性信息。5.根据权利要求4所述的方法,其特征在于,所述获取异常解释性信息,包括:接收所述解释性信息的判定信息,所述判定信息用于指示所述解释性信息的解释内容是否异常;将判定信息指示解释内容异常的解释性信息确定为所述异常解释性信息。6.根据权利要求4所述的方法,其特征在于,所述输出结果是所述机器学习模型基于的输入信息生成的,所述基于所述输出结果生成解释性信息,包括:获取所述输出结果对应的输入信息;在所述训练样本集中确定与所述输入信息距离小于预设距离阈值或者距离最近的目标样本;生成所述解释性信息,所述解释性信息包括所述目标样本包括的特征以及特征值,以及预先获取的所述目标样本中各个特征的权值。7.根据权利要求6所述的方法,其特征在于,在所述获取异常解释性信息之前,所述方法还包括:
采用聚类算法将所述训练样本集划分为多类训练样本,在每一类训练样本中确定一个参考样本;获取所述训练样本集中参考样本的特征以及特征值,并获取所述参考样本中各个特征的权值;所述在所述训练样本集中确定与所述输入信息距离小于预设距离阈值或者距离最近的目标样本,包括:在所述训练样本集包括的参考样本中确定与所述输入信息距离小于预设距离阈值或者距离最近的目标样本。8.根据权利要求7所述的方法,其特征在于,所述获取所述参考样本中各个特征的权值,包括:采用局部可解释性模型算法LIME获取所述参考样本中各个特征的权值。9.根据权利要求5所述的方法,其特征在于,所述解释性信息包括一个或多个特征,以及所述特征的特征值,所述将判定信息指示解释内容异常的解释性信息确定为所述异常解释性信息,包括:当所述判定信息指示所述解释性信息中的任一特征为异常特征时,确定所述解释性信息为异常解释性信息。10.根据权利要求1至9任一所述的方法,其特征在于,所述解释性信息包括每个所述特征值所处的特征值范围和/或与所述输出结果对应的所述机器学习模型所支持的每种分类的概率。11.一种模型更新装置,其特征在于,所述装置包括:第一获取模块,用于获取异常解释性信息,所述异常解释性信息为解释内容异常的解释性信息,所述解释性信息是用于解释机...

【专利技术属性】
技术研发人员:段戎黄文文
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1