模型更新方法及装置制造方法及图纸

技术编号：33325765 阅读：12 留言：0更新日期：2022-05-08 09:04

本申请公开了一种模型更新方法及装置，属于AI领域。所述方法包括：获取异常解释性信息，所述异常解释性信息为解释内容异常的解释性信息，所述解释性信息是用于解释机器学习模型的输出结果的信息；基于所述异常解释性信息，调整所述机器学习模型的训练样本集；获取更新后的机器学习模型，所述机器学习模型基于调整后的训练样本集训练得到。本申请能够提高更新后的机器学习模型的可靠性。后的机器学习模型的可靠性。后的机器学习模型的可靠性。

全部详细技术资料下载

【技术实现步骤摘要】
模型更新方法及装置

[0001]本申请涉及人工智能(Artificial Intelligence，AI)领域，特别涉及一种模型更新方法及装置。

技术介绍

[0002]机器学习，是指让机器基于训练样本训练出机器学习模型，使机器学习模型对训练样本之外的数据具有预测能力(如类别预测能力)。机器学习作为AI领域的一个重要分支，在众多领域得到了广泛的应用。
[0003]随着环境或规则等的改变，原有的机器学习模型需要随时间进行更新。目前，机器学习模型的更新由人为经验触发或者周期性更新，更新灵活性较低，导致更新后的机器学习模型的可靠性较低。

技术实现思路

[0004]本申请实施例提供了一种模型更新方法及装置。该技术方案如下：
[0005]第一方面，提供了一种模型更新方法，该方法可以由计算机设备执行，该方法包括：
[0006]获取异常解释性信息，该异常解释性信息为解释内容异常的解释性信息，该解释性信息是用于解释机器学习模型的输出结果的信息；基于该异常解释性信息，调整该机器学习模型的训练样本集；获取更新后的机器学习模型，该机器学习模型基于调整后的训练样本集训练得到。
[0007]本申请实施例提供的模型更新方法，在获取异常解释性信息后，基于获取的异常解释性信息，调整该机器学习模型的训练样本集，从而采用该训练样本集获取更新后的机器学习模型。如此，实现基于异常解释性信息的模型的自动更新，有效提高模型更新的灵活性，从而提高更新后的机器学习模型的可靠性。
[0008]其中，该解释性信息包...

【技术保护点】

【技术特征摘要】
1.一种模型更新方法，其特征在于，所述方法包括：获取异常解释性信息，所述异常解释性信息为解释内容异常的解释性信息，所述解释性信息是用于解释机器学习模型的输出结果的信息；基于所述异常解释性信息，调整所述机器学习模型的训练样本集；获取更新后的机器学习模型，所述机器学习模型基于调整后的训练样本集训练得到。2.根据权利要求1所述的方法，其特征在于，所述解释性信息包括一个或多个特征，以及所述特征的特征值，所述基于所述异常解释性信息，调整所述机器学习模型的训练样本集，包括：将训练样本集中的目标训练样本对应的标签更新，得到调整后的训练样本集，其中，所述目标训练样本包括与所述异常解释性信息中的异常特征相同的目标特征，且所述目标特征的特征值与所述异常特征的异常特征值相同。3.根据权利要求2所述的方法，其特征在于，所述将训练样本集中的目标训练样本对应的标签更新，得到调整后的训练样本集，包括：获取初始的x值，1≤x＜y，并基于初始的x值，执行至少两次重训练流程，直至达到预设截止条件，所述y为所述训练样本集中目标训练样本的总数；将所述至少两次重训练流程得到的机器学习模型中的验证效果最优的机器学习模型所对应的训练样本集确定为所述调整后的训练样本集；其中，所述重训练流程包括：将所述训练样本集中x个目标训练样本对应的标签更新为相反的标签；基于标签更新后的训练样本集，训练所述机器学习模型，得到重训练后的机器学习模型；增大x得到更新后的x，再次执行所述重训练流程。4.根据权利要求1至3任一所述的方法，其特征在于，在所述获取异常解释性信息之前，所述方法还包括：在接收到所述机器学习模型的输出结果后，基于所述输出结果生成解释性信息；显示生成的解释性信息。5.根据权利要求4所述的方法，其特征在于，所述获取异常解释性信息，包括：接收所述解释性信息的判定信息，所述判定信息用于指示所述解释性信息的解释内容是否异常；将判定信息指示解释内容异常的解释性信息确定为所述异常解释性信息。6.根据权利要求4所述的方法，其特征在于，所述输出结果是所述机器学习模型基于的输入信息生成的，所述基于所述输出结果生成解释性信息，包括：获取所述输出结果对应的输入信息；在所述训练样本集中确定与所述输入信息距离小于预设距离阈值或者距离最近的目标样本；生成所述解释性信息，所述解释性信息包括所述目标样本包括的特征以及特征值，以及预先获取的所述目标样本中各个特征的权值。7.根据权利要求6所述的方法，其特征在于，在所述获取异常解释性信息之前，所述方法还包括：
采用聚类算法将所述训练样本集划分为多类训练样本，在每一类训练样本中确定一个参考样本；获取所述训练样本集中参考样本的特征以及特征值，并获取所述参考样本中各个特征的权值；所述在所述训练样本集中确定与所述输入信息距离小于预设距离阈值或者距离最近的目标样本，包括：在所述训练样本集包括的参考样本中确定与所述输入信息距离小于预设距离阈值或者距离最近的目标样本。8.根据权利要求7所述的方法，其特征在于，所述获取所述参考样本中各个特征的权值，包括：采用局部可解释性模型算法LIME获取所述参考样本中各个特征的权值。9.根据权利要求5所述的方法，其特征在于，所述解释性信息包括一个或多个特征，以及所述特征的特征值，所述将判定信息指示解释内容异常的解释性信息确定为所述异常解释性信息，包括：当所述判定信息指示所述解释性信息中的任一特征为异常特征时，确定所述解释性信息为异常解释性信息。10.根据权利要求1至9任一所述的方法，其特征在于，所述解释性信息包括每个所述特征值所处的特征值范围和/或与所述输出结果对应的所述机器学习模型所支持的每种分类的概率。11.一种模型更新装置，其特征在于，所述装置包括：第一获取模块，用于获取异常解释性信息，所述异常解释性信息为解释内容异常的解释性信息，所述解释性信息是用于解释机...

【专利技术属性】
技术研发人员：段戎，黄文文，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人