一种可拓展的人工智能攻击基准测试方法及系统技术方案

技术编号：40002666 阅读：10 留言：0更新日期：2024-01-09 04:05

本发明专利技术提供一种可拓展的人工智能攻击基准测试方法及系统，模型转换模块根据对被测模型的类型和框架进行转化，得到与攻击框架匹配的被测模型的转换模型。数据集对转换模型进行攻击，得到一测试结果。攻击框架调取格式统一的各攻击算法并生成相应攻击脚本后对转换模型进行若干次攻击，从而得到若干攻击结果。下个被测模型进行测试时所述模型转换模块再次根据其类型对其框架进行转化后进行攻击。优点是能够对不同根据不同的人工智能模型灵活转换，对转换后模型进行攻击得到攻击结果，无需针对不同人工智能模型重新搭建测试模组，提升攻击效率降低测试成本，解决现有技术中测试方法(框架)受到被测模型和语言限制的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能安全、人工智能测评领域，尤其涉及一种可拓展的人工智能攻击基准测试方法及系统。

技术介绍

1、近年来，人工智能技术发展迅速，人工智能算法在各行各业的应用越来越普遍。但随着研究人员对人工智能算法的深入研究，多种针对人工智能模型的恶意攻击算法被专利技术出来。这些算法有些会生成恶意数据来欺骗人工智能模型，令其产生错误的预测结果；有些会通过在训练数据中投放恶意数据在人工智能模型中安插后门；有些则会根据人工智能模型给出的结果来反推其训练数据。

2、针对以上问题，为方便对人工智能模型的稳健性进行测试，一些集成了多种攻击方法的攻击框架或系统被提出，这些框架或系统可以方便地对模型使用多种攻击方法进行攻击以测试模型对这些攻击方法的抵抗性。但是这些方法或多或少在兼容性，可拓展性和易用性上存在以下问题：

3、第一，现有的攻击框架或系统往往只针对一种类型的人工智能模型，目前没有能同时支持攻击nlp模型和图像识别模型的框架。

4、第二，现有的攻击框架或系统往往对被测人工智能模型构建时使用的框架和语言有所要求，框架和语言之间有壁垒，如针对tensorflow模型的攻击框架不能对pytorch模型使用。针对python版本tensorflow模型的攻击框架无法对java版本tensorflow模型进行攻击。

5、第三，自动化程度低，即便是采用攻击框架或系统进行攻击测量，也需要每次攻击都重新构建攻击脚本代码，若需进行多个攻击测试依然需要很大的工作量。这是由于这些框架或系统往往都是根据一些标准模

6、第四，由于学术界对于攻击方法的研究处于探索阶段，各种新的攻击方法出现较快，目前的工具缺少灵活性，难以快速集成新出现的攻击方法。

7、所以如何能够提供一种能够不受被测模型和语言限制的测试方法(框架)成为亟待解决的问题。

技术实现思路

1、本专利技术提供一种可拓展的人工智能攻击基准测试方法及系统，用以解决现有技术中测试方法(框架)受到被测模型和语言限制的问题。

2、为了实现上述目的，本专利技术技术方案提供了可拓展的人工智能攻击基准测试方法，方法包括：选择被测模型的框架以及攻击测试时采用的攻击类型；模型转换模块对所述被测模型进行转化，转化包括根据所述被测模型的类型对其框架进行转化，转化后得到与攻击框架匹配的所述被测模型的转换模型。载入数据集及所述转换模型，采用所述数据集对所述转换模型进行攻击，得到一测试结果。攻击框架调取格式统一的各攻击算法并生成相应攻击脚本，根据所述攻击脚本对所述转换模型进行若干次攻击，从而得到若干攻击结果。后一被测模型进行测试时所述模型转换模块再次根据其类型对其框架进行转化后进行攻击。

3、作为上述技术方案的优选，较佳的，构建所述模型转换模块，包括：设置一能够描述共有元素的总基类，设置一具有不同类型模型与不同函数之间的映射关系的类型模块；设置框架模块，所述框架模块中包括与各类型模型对应的不同机器学习框架及不同函数，使得被测模型的类型和框架在分别被转化后能够结合。设置人工智能模型功能模块，包括回归功能模块和分类功能模块。

4、作为上述技术方案的优选，较佳的，设置一分类模块，其包含功能为分类功能的各人工智能模型对应的分类基类；设置一回归模块，其包含功能为回归功能的各人工智能模型对应的回归基类；当所述被测模型被转化完毕后，所述回归模块或所述分类模块输出最终的所述转换模型。

5、作为上述技术方案的优选，较佳的，包括：若所述攻击框架中没有本次所需使用的攻击算法，则可采用外挂攻击模块，序列化模块和命令生成模块协同工作，将所述外挂攻击模块中攻击算法的格式与所述攻击算法统一；还可以在拓展编写前端中添加所需的攻击算法，所述拓展编写前端将新的攻击算法添加至所述攻击框架中。

6、作为上述技术方案的优选，较佳的，若所述被测模型的类型和/或框架种类未在所述模型转换模块找到，则用户在拓展编写前端中添加当前被测模型的类型和/或框架种类，所述拓展编写前端将新的类型和/或框架种类添加至所述模型转换模块中。

7、作为上述技术方案的优选，较佳的，当所述后一被测模型的回归基类/ 分类基类未在所述模型转换模块内，则在所述模型转换模块的最后一层复写一对应类以实现对所述后一被测模型的转换。

8、本专利技术还提供一种可拓展的人工智能攻击基准测试系统，包括，可视化界面前端、拓展编写前端、后台处理端、结果显示端。

9、可视化界面端，包含图形显示界面，用于用户选择目标模型文件的路径、测试集路径、模型类型、模型使用框架、攻击名称、攻击参数设置。

10、拓展编写前端，包含模型转换拓写模块和攻击算法拓写模块类，用于拓写所述后台运行端中模型转换模块和攻击算法模块中没有的人工智能模型基类、人工智能模型类型、人工智能模型框架、攻击算法。

11、后台运行端，包含由序列化模块、命令生成模块、数据集格式转化模块、攻击脚本生成模块组成的攻击准备模块，还包含模型转换模块和攻击算法模块，用于根据所述可视化界面端接收的用户选择命令对被测模型进行转化，对转化后得到的转换模型进行攻击测试；其中，攻击测试包括数据集测试和攻击模块攻击测试。

12、结果显示模块用于显示被测人工智能模型名称、被测人工智能模型类型、被测人工智能模型的blake2码、测试集结果、攻击结果列表。

13、作为上述技术方案的优选，较佳的，包括：序列化模块用于，将用户在所述图形界面所做的选项转化成序列化的参数字符串。命令生成模块用于，当使用外挂攻击模块时，根据所述序列化参数生成对所述转换模型进行攻击测试的命令。数据集格式转化模块用于，若用户选择的数据集格式与转化后的转换模型不匹配，将数据集格式转换为与所述转换模型匹配的格式。攻击脚本生成模块用于，根据所述攻击算法模块调取的攻击算法生成相应攻击脚本用于攻击测试。

14、作为上述技术方案的优选，较佳的，模型转换模块包括：总基类，用于描述各人工智能模型共有的元素；类型模块，用于向框架模块输入被测模型的类型，所述类型模块有不同类型模型与不同函数之间的映射关系。框架模块，用于将各类型模型与不同机器学习框架及不同函数对应，使得被测模型的类型和框架在分别被转化后能够结合。人工智能模型功能模块，用于对所述被测模型的功能进行分类，其包括回归功能模块和分类功能模块。当根据所述人工智能模型功能模块对所述被测模型的分类结果为分类功能，所述分类模块用于，根据所述框架模块对所述被测模型的框架分类结果对所述被测模型进行基于分类基类的转化。当根据所述人工智能模型功能模块对所述被测模型的分类结果为回归功能，所述回归模块用于，根据所述框架模块对所述被测模型的框架分类结果对所述被测模型进行基于回归基类的转化。转化输出模块，用于当所述被本文档来自技高网...

【技术保护点】

1.一种可拓展的人工智能攻击基准测试方法，其特征在于，所述方法包括：

2.根据权利要求1所述的可拓展的人工智能攻击基准测试方法，其特征在于，构建所述模型转换模块，包括：

3.根据权利要求2所述的可拓展的人工智能攻击基准测试方法，其特征在于，设置一分类模块，其包含功能为分类功能的各人工智能模型对应的分类基类；设置一回归模块，其包含功能为回归功能的各人工智能模型对应的回归基类；当所述被测模型被转化完毕后，所述回归模块或所述分类模块输出最终的所述转换模型。

4.根据权利要求1所述的可拓展的人工智能攻击基准测试方法，其特征在于，包括：

5.根据权利要求1所述的可拓展的人工智能攻击基准测试方法，其特征在于，若所述被测模型的类型和/或框架种类未在所述模型转换模块找到，则用户在拓展编写前端中添加当前被测模型的类型和/或框架种类，所述拓展编写前端将新的类型和/或框架种类添加至所述模型转换模块中。

6.根据权利要求1所述的可拓展的人工智能攻击基准测试方法，其特征在于，当所述后一被测模型的回归基类/分类基类未在所述模型转换模块内，则在所述模

7.一种可拓展的人工智能攻击基准测试系统，其特征在于，包括，可视化界面前端、拓展编写前端、后台处理端、结果显示端，

8.根据权利要求7所述的可拓展的人工智能攻击基准测试系统，其特征在于，包括：

9.根据权利要求根据权利要求7所述的可拓展的人工智能攻击基准测试系统，其特征在于，所述模型转换模块包括：

10.根据权利要求根据权利要求7所述的可拓展的人工智能攻击基准测试系统，其特征在于，攻击算法模块包括：

...

【技术特征摘要】

1.一种可拓展的人工智能攻击基准测试方法，其特征在于，所述方法包括：

2.根据权利要求1所述的可拓展的人工智能攻击基准测试方法，其特征在于，构建所述模型转换模块，包括：

4.根据权利要求1所述的可拓展的人工智能攻击基准测试方法，其特征在于，包括：

5.根据权利要求1所述的可拓展的人工智能攻击基准测试方法，其特征在于，若所述被测模型的类型和/或框架种类未在所述模型转换模块找到，则用户在拓展编写前端中添加当前被测模型的类型...

【专利技术属性】
技术研发人员：胡师阳，邱晓慧，杨波，赵孟晨，佟冬，孙璞，
申请(专利权)人：北京银联金卡科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人