用于经训练的模型偏差评价的技术制造技术

技术编号:41562022 阅读:49 留言:0更新日期:2024-06-06 23:45
公开了一种系统,该系统被配置为对机器学习(ML)模型执行各种偏差检查,以便识别ML模型可能固有的一个或多个偏差(如果有的话)。然后,将通过执行检查生成的偏差评估结果报告给用户,诸如报告给ML模型的消费者、负责建模和训练ML模型的数据科学家等。偏差评估系统通过使用ML模型中存在的属性或用于训练ML模型的训练数据集生成合成数据集来执行一个或多个偏差检查。然后,通过将综合生成的合成数据集的输入数据点输入到ML模型中来生成预测数据。然后对预测数据进行处理并评估偏差。评估的结果可以被编译成偏差评估报告。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、近年来,人工智能(ai)和机器学习(ml)解决方案在各种不同行业和应用中的采用迅速增加。对于典型的ml解决方案,在训练阶段,使用某些特定的训练和验证数据集来训练和验证ml模型。一旦模型在训练阶段达到可接受的准确度水平,该模型就被部署到生产环境中,在该环境中该模型被用于对实时生产数据输入进行预测。然而,如果用于训练ml模型的特定训练数据集包含有偏差的(biased)数据,那么经训练的ml模型也会做出有偏差的预测。

2、偏差是ml中常见但重要的问题,并且是ml模型做出的许多不正确预测的根源,并且会导致现实世界场景中的模型不稳定。例如,受偏差影响的ml模型不仅可能无法预测正确信息,而且还可能预测出ml模型将其表示为正确预测的不正确信息。这给为客户托管经训练的ml模型的服务带来了问题,并且当服务托管未在该服务的监督下训练的ml模型时问题会变得复杂。偏差并不是可以简单地通过增加训练数据集的尺寸来解决的问题,并且事实上,较大的有偏差的训练数据集只会强化经训练的ml模型中的不想要的偏差行为。在许多情况下,经训练的ml模型本身就是“黑箱”元素,本文档来自技高网...

【技术保护点】

1.一种计算机实现的方法,包括:

2.如权利要求1所述的计算机实现的方法,其中第一偏差结果包括基于第一预测数据生成的一个或多个偏差值。

3.如权利要求2所述的计算机实现的方法,其中偏差评估报告包括第一偏差结果和所述一个或多个偏差值,并且该方法还包括输出偏差评估报告。

4.如权利要求2所述的计算机实现的方法,还包括:

5.如权利要求1所述的计算机实现的方法,还包括:

6.如权利要求5所述的计算机实现的方法,还包括:

7.如权利要求1所述的计算机实现的方法,其中确定模型属性的集合包括处理经训练的模型以确定模型属性的集合中...

【技术特征摘要】
【国外来华专利技术】

1.一种计算机实现的方法,包括:

2.如权利要求1所述的计算机实现的方法,其中第一偏差结果包括基于第一预测数据生成的一个或多个偏差值。

3.如权利要求2所述的计算机实现的方法,其中偏差评估报告包括第一偏差结果和所述一个或多个偏差值,并且该方法还包括输出偏差评估报告。

4.如权利要求2所述的计算机实现的方法,还包括:

5.如权利要求1所述的计算机实现的方法,还包括:

6.如权利要求5所述的计算机实现的方法,还包括:

7.如权利要求1所述的计算机实现的方法,其中确定模型属性的集合包括处理经训练的模型以确定模型属性的集合中的至少一个模型属性。

8.如权利要求1所述的计算机实现的方法,其中确定模型属性的集合包括基于对用于训练和生成经训练的模型的训练数据的分析来确定模型属性的集合中的至少一个模型属性。

9.如权利要求1所述的计算机实现的方法,还包括:

10.如权利要求1所述的计算机实现的方法,其中生成第一合成数据集包括由计算系统基于针对经训练的模型的模型属性的集合并使用生成式神经网络机器学习模型来生成第一合成数据集。

【专利技术属性】
技术研发人员:H·B·桑卡拉纳拉亚南S·雷扎A·卡蒂亚尔
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1