一种模型漂移检测方法、装置、设备及其存储介质制造方法及图纸

技术编号：37962977 阅读：13 留言：0更新日期：2023-06-30 09:38

本申请实施例属于人工智能及数字医疗技术领域，涉及一种模型漂移检测方法、装置、设备及其存储介质，用于对树型决策模型的模型漂移进行检测，尤其是在数字医疗等多特征影响因子的应用领域，在进行综合模型训练和改进时，往往随着数据量的增量累加，容易造成各个特征因子对应的决策权重发生变化，或者模型中引入了新的特征影响因子，这些变化都会使得模型的预测结果产生变化，将所述树型决策模型的模型漂移检测方法应用到数字医疗技术领域，能够进一步的辅助医疗人员进行决策工作，更加智能化，识别目标决策模型是否训练完成或者趋于成熟状态，避免了将不成熟的医疗模型过早的投入到数字医疗中，更加慎重和科学化。更加慎重和科学化。更加慎重和科学化。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型漂移检测方法、装置、设备及其存储介质

[0001]本申请涉及人工智能及数字医疗
，尤其涉及一种模型漂移检测方法、装置、设备及其存储介质。

技术介绍

[0002]随着人工智能行业的快速发展，基于人工智能模型的智能决策已被逐渐应用到各个行业领域，传统医疗行业也考虑结合计算机以及人工智能技术往数字医疗领域进行转型，医疗行业由于其涉及的业务以及病种的繁杂性，往往在进行业务决策时由多维度的特征影响因子，良好的决策模型可解释性能有效地减少算法团队与模型下游用户之间的信任危机，并有助于识别模型更新迭代过程中的某些不稳定因素，更好的辅助医疗机构进行精准决策。
[0003]特征因子在对模型进行增量式训练或者增量式决策过程中，随着医疗数据样本数量逐渐增加，可能会引入新的决策特征信息或者原有决策特征信息对应的分配比例逐渐由变化较大慢慢变化为趋于稳定，在这个过程中，为了对模型进行可用性解析，随着模型训练的逐渐成熟，模型的输出误差值应当逐渐减小直至输出误差值趋于稳定，则代表模型训练成功。目前，主要采用SHAP（Shapley Additive ex本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型漂移检测方法，其特征在于，包括下述步骤：获取检测集，其中，所述检测集中包括若干个检测样本以及各个检测样本的特征影响因子信息，所述特征影响因子信息包括特征影响因子的名称和表征数据；将所述检测集输入到训练完成的树型决策模型内进行增量式决策处理，并分别获取本次增量式决策处理前后所述树型决策模型分别对应的树型决策结果，其中，本次增量式决策处理前后所述树型决策模型对应的树型决策结果包括第一树型决策结果和第二树型决策结果；获取所述树型决策模型的各个决策节点；基于所述第一树型决策结果、所述第二树型决策结果、所述各个决策节点以及本次增量式决策处理前后分别对应的样本总量，获取所述树型决策模型经本次增量式决策处理前后分别对应的决策概率分布集合；根据所述树型决策模型经本次增量式决策处理前后分别对应的决策概率分布集合以及预设的第一算法公式，获取本次增量式决策处理前后所述树型决策模型内各个决策节点分别引起的模型输出结果变化；基于所述树型决策模型内各个决策节点分别引起的模型输出结果变化以及预设的第二算法公式，检测所述树型决策模型的模型漂移。2.根据权利要求1所述的模型漂移检测方法，其特征在于，在执行所述将所述检测集输入到训练完成的树型决策模型内进行增量式决策处理的步骤之前，所述方法还包括：获取训练集，其中，所述训练集中包括若干个训练样本、各个训练样本的特征影响因子信息以及预设的目标训练结果，所述特征影响因子信息包括特征影响因子的名称和表征数据；将所述预设的目标训练结果设置为预构建的树型决策模型的输出参数；将所述特征影响因子的名称设置为预构建的树型决策模型的各个决策节点；将所述训练集输入到预构建的树型决策模型，进行模型训练，通过所述特征影响因子的表征数据和所述输出参数，训练出所述各个决策节点对应的特征权重，完成对所述树型决策模型的训练。3.根据权利要求2所述的模型漂移检测方法，其特征在于，所述将所述检测集输入到训练完成的树型决策模型内进行增量式决策处理的步骤，具体包括：根据所述树型决策模型内的各个决策节点、所述各个检测样本中特征影响因子的名称和表征数据对所述检测集中若干个检测样本进行决策分类，获得决策分类结果；根据所述决策分类结果，识别各个决策节点处所包含的检测样本；根据识别结果，统计出各个决策节点所包含的所有检测样本，作为第一统计结果；基于所述各个决策节点所包含的所有检测样本的特征影响因子数据和所述各个决策节点对应的特征权重，进行乘积运算，获取各个决策节点的检测特征值。4.根据权利要求3所述的模型漂移检测方法，其特征在于，所述分别获取本次增量式决策处理前后所述树型决策模型分别对应的树型决策结果的步骤，具体包括：根据所述树型决策模型内的各个决策节点、所述各个训练样本中特征影响因子的名称和表征数据对所述训练集中若干个训练样本进行决策分类，获得决策分类结果；根据所述决策分类结果，识别各个决策节点处所包含的训练样本；
根据识别结果，统计出各个决策节点所包含的所有训练样本，作为第二统计结果；将所述第二统计结果作为本次增量式决策处理前所述树型决策模型对应的第一树型决策结果；根据所述第一统计结果和所述第二统计结果，统计出各个决策节点所包含的所有样本，作为第三统计结果；将所述第三统计结果作为本次增量式决策处理后所述树型决策模型对应的第二树型决策结果。5.根据权利要求4所述的模型漂移检测方法，其特征在于，本次增量式决策处理前后分别对应的样本总量包括第一样本总量和第二样本总量，本次增量式决策处理前后分别对应的决策概率分布集合包括第一决策概率分布集合和第二决策概率分布集合，所述获取所述树型决策模型经本次增量式决策处理前后分别对应的决策概率分布集合的步骤，具体包括：基于所述第二统计结果，统计出本次增量式决策处理前每个决策节点所包含的样本数量；根据所述本次增量式决策处理前每个决策节点所包含的样本数量以及本次增量式决策处理前的第一样本总量，进行比值运算，获取本次...

【专利技术属性】
技术研发人员：徐赛奕，张振勇，崔跃，张霖，朱艳乔，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人