用于模型评估的方法、装置、设备和存储介质制造方法及图纸

技术编号：40111358 阅读：24 留言：0更新日期：2024-01-23 19:13

根据本公开的实施例，提供了用于模型评估的方法、装置、设备和存储介质。该方法包括：获得针对模型输入的第一版本的评估规则，评估规则用于评估第一机器学习模型针对模型输入所生成的模型输出的质量；确定针对第一版本的评估规则的第一对抗攻击的结果，第一对抗攻击包括：针对模型输入构造至少一个模型输出，并且利用第一版本的评估规则来评估所构造的至少一个模型输出的质量；响应于第一对抗攻击的结果指示第一对抗攻击的成功，更新第一版本的评估规则，以得到第二版本的评估规则；以及基于模型输入和第二版本的评估规则来确定第一机器学习模型的性能等级。由此，能够获得针对各个测试样本的更准确、恰当的规则用于模型性能评估。

全部详细技术资料下载

【技术实现步骤摘要】

本公开的示例实施例总体涉及计算机，特别地涉及用于模型评估的方法、装置、设备和计算机可读存储介质。

技术介绍

1、随着机器学习、深度学习技术已经在许多领域中获得广泛应用。机器学习模型能够被配置和训练为基于给定的模型输入，生成对应的模型输出。机器学习模型可以被应用于自然语言处理、机器翻译、语音合成、图像生成等领域，未来可以将其应用于更多的领域，例如医疗、金融、教育等。在模型训练后，通常期望能够准确评估模型的性能，以确定训练效果、后续应用方式等。

技术实现思路

1、在本公开的第一方面，提供了一种模型评估的方法。该方法包括：针对第一机器学习模型的测试样本中的模型输入，获得针对模型输入的第一版本的评估规则，评估规则用于评估第一机器学习模型针对模型输入所生成的模型输出的质量；确定针对第一版本的评估规则的第一对抗攻击的结果，第一对抗攻击包括：针对模型输入构造至少一个模型输出，并且利用第一版本的评估规则来评估所构造的至少一个模型输出的质量；响应于第一对抗攻击的结果指示第一对抗攻击的成功，更新第一版本的评估...

【技术保护点】

1.一种模型评估的方法，包括：

2.根据权利要求1所述的方法，还包括：

3.根据权利要求1所述的方法，其中更新所述第一版本的评估规则包括：

4.根据权利要求3所述的方法，其中在所述第一对抗攻击之前存在至少一次历史对抗攻击，并且其中所述更新目标是使得利用所述第二版本的评估规则能够正确评估在所述第一对抗攻击和所述至少一次历史对抗攻击中所构造的模型输出的质量。

5.根据权利要求1所述的方法，其中所构造的至少一个模型输出包括以下至少一项：

6.根据权利要求5所述的方法，其中确定所述第一对抗攻击的结果包括：