【技术实现步骤摘要】
本公开的示例实施例总体涉及计算机,特别地涉及用于模型评估的方法、装置、设备和计算机可读存储介质。
技术介绍
1、随着机器学习、深度学习技术已经在许多领域中获得广泛应用。机器学习模型能够被配置和训练为基于给定的模型输入,生成对应的模型输出。机器学习模型可以被应用于自然语言处理、机器翻译、语音合成、图像生成等领域,未来可以将其应用于更多的领域,例如医疗、金融、教育等。在模型训练后,通常期望能够准确评估模型的性能,以确定训练效果、后续应用方式等。
技术实现思路
1、在本公开的第一方面,提供了一种模型评估的方法。该方法包括:针对第一机器学习模型的测试样本中的模型输入,获得针对模型输入的第一版本的评估规则,评估规则用于评估第一机器学习模型针对模型输入所生成的模型输出的质量;确定针对第一版本的评估规则的第一对抗攻击的结果,第一对抗攻击包括:针对模型输入构造至少一个模型输出,并且利用第一版本的评估规则来评估所构造的至少一个模型输出的质量;响应于第一对抗攻击的结果指示第一对抗攻击的成功,更新第一版本的评估
...【技术保护点】
1.一种模型评估的方法,包括:
2.根据权利要求1所述的方法,还包括:
3.根据权利要求1所述的方法,其中更新所述第一版本的评估规则包括:
4.根据权利要求3所述的方法,其中在所述第一对抗攻击之前存在至少一次历史对抗攻击,并且其中所述更新目标是使得利用所述第二版本的评估规则能够正确评估在所述第一对抗攻击和所述至少一次历史对抗攻击中所构造的模型输出的质量。
5.根据权利要求1所述的方法,其中所构造的至少一个模型输出包括以下至少一项:
6.根据权利要求5所述的方法,其中确定所述第一对抗攻击的结果包括:
【技术特征摘要】
1.一种模型评估的方法,包括:
2.根据权利要求1所述的方法,还包括:
3.根据权利要求1所述的方法,其中更新所述第一版本的评估规则包括:
4.根据权利要求3所述的方法,其中在所述第一对抗攻击之前存在至少一次历史对抗攻击,并且其中所述更新目标是使得利用所述第二版本的评估规则能够正确评估在所述第一对抗攻击和所述至少一次历史对抗攻击中所构造的模型输出的质量。
5.根据权利要求1所述的方法,其中所构造的至少一个模型输出包括以下至少一项:
6.根据权利要求5所述的方法,其中确定所述第一对抗攻击的结果包括:
7.根据权利要求1所述的方法,其中所构造的所述至少一个模型输出是利用第二机器学习模型基于所述模型输入和所述第一版本的评估规则来生成的。
【专利技术属性】
技术研发人员:陈修元,林苑,张雨辰,
申请(专利权)人:北京有竹居网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。