一种高效的规模化人工智能模型安全性评估方法及装置制造方法及图纸

技术编号：35902644 阅读：21 留言：0更新日期：2022-12-10 10:39

本发明专利技术公开了一种高效的规模化人工智能模型安全性评估方法及装置，其中方法包括：对待测人工智能模型的输入进行预处理，并根据使用的攻击和防御方法生成相应的配置文件；对物理资源进行监控，实时记录资源使用情况；将所有对抗攻击方法打包为Docker镜像形式保存在镜像库，根据为待测人工智能模型生成的配置文件以及资源使用情况启动对应的测试任务，从镜像库中启动相应攻击方法的镜像容器，被启动的镜像容器根据配置文件自动执行攻击算法，攻击结束后将镜像容器返回的结果保存至数据库。可实现不同框架模型之间的统一格式转换和描述，支持多种人工智能框架，可实现对抗样本攻击算法的虚拟化和容器化。法的虚拟化和容器化。法的虚拟化和容器化。

全部详细技术资料下载

【技术实现步骤摘要】
一种高效的规模化人工智能模型安全性评估方法及装置

[0001]本专利技术涉及人工智能
，尤其涉及一种高效的规模化人工智能模型安全性评估方法及装置。

技术介绍

[0002]近几年对人工智能的研究和应用发展非常迅速，机器学习和深度学习模型大量应用在现实生活中，例如智能驾驶，语音识别等。尽管人工智能的广泛应用成功的为人类解决了某些复杂问题，但是有研究表明人工智能技术也面临多种不容忽视的安全威胁，攻击者可以通过构造加入了人眼难以察觉的轻微扰动的对抗样本来干扰人工智能模型的判断，甚至可以更改模型的输出为攻击者想要的任意结果，随着人工智能算法的不断发展和攻防双方对抗的逐步激化，如何保证深度学习模型的安全成为一个迫在眉睫的问题。
[0003]因此需要在人工智能模型投入使用前对其进行安全分析。但目前人工智能框架繁多，常见的有Pytorch，TensorFlow，MXNet等，目前已有的对模型进行安全分析的方法通常是使用对抗攻击和防御方法针对某个框架或特定模型的，这些模型通常需要多种多样的运行环境，且模型本身体积较大，具有通用性差，部署困难，使用门槛高等缺点。

技术实现思路

[0004]为了解决上述问题，本专利技术提出一种高效的规模化人工智能模型安全性评估方法及装置，可实现不同框架模型之间的统一格式转换和描述，支持多种人工智能框架，可实现对抗样本攻击算法的虚拟化和容器化；能够对多个同时运行的攻击容器进行资源管理与调度，使之更有效的利用物理资源；能够自动对人工智能模型进行黑白盒攻击测试，并可以生成对抗样本，...

【技术保护点】

【技术特征摘要】
1.一种高效的规模化人工智能模型安全性评估方法，其特征在于，包括：测试配置生成：对待测人工智能模型的输入进行预处理，并根据使用的攻击和防御方法生成相应的配置文件；资源监控：对物理资源进行监控，实时记录资源使用情况；容器调度管理：将所有对抗攻击方法打包为Docker镜像形式保存在镜像库，根据为待测人工智能模型生成的配置文件以及资源使用情况启动对应的测试任务，从镜像库中启动相应攻击方法的镜像容器，被启动的镜像容器根据配置文件自动执行攻击算法，攻击结束后将镜像容器返回的结果保存至数据库。2.根据权利要求1所述的高效的规模化人工智能模型安全性评估方法，其特征在于，测试配置生成过程中，使用ONNX即开放神经网络交换技术对输入的待测人工智能模型进行转换，自动判断待测人工智能模型的框架格式，并根据格式调用相应框架的ONNX转换代码容器，完成从目标模型到ONNX模型的格式转换。3.根据权利要求1所述的高效的规模化人工智能模型安全性评估方法，其特征在于，完成对待测人工智能模型的攻击后，会生成若干对抗样本文件，通过统计其中攻击成功和攻击失败的样本个数，以及每个对抗样本与原始样本的差别从而得到安全性评估指标。4.根据权利要求3所述的高效的规模化人工智能模型安全性评估方法，其特征在于，所述安全性评估指标包括误分类率、对抗样本类别平均置信度、正确类别平均置信度和平均失真。5.根据权利要求3所述的高效的规模化人工智能模型安全性评估方法，其特征在于，误分类率的高低直接反映了攻击的有效性，对于非目标攻击而言误分类率是指将样本错误地分类到任意除正确的类别中的频率，而对于目标攻击来说误分类率是指将样本错误归类到指定的类别中的频率；误分类率的计算公式为：指定的类别中的频率；误分类率的计算公式为：其中N为样本总数，为生成的第i个对抗样本的类别，y
i
为对应的第i个原始样本类别，为第i个样本的目标攻击类别。6.根据权利要求3所述的高效的规模化人工智能模型安全性评估方法，其特征在于，对抗样本类别平均置信度是对错误分类的可靠性进行评估的指标，值越大反映模型的误判程度越大，证明在相同攻击参数下模型鲁棒性越低；对抗样本类别平均置信...

【专利技术属性】
技术研发人员：王一凡，孙治，和达，权赵恒，何秉钧，陈剑锋，
申请(专利权)人：中国电子科技网络信息安全有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人