基于神经网络中间层正则化的黑盒攻击型防御系统及方法技术方案

技术编号：27608258 阅读：12 留言：0更新日期：2021-03-10 10:33

本发明专利技术涉及人工智能安全领域，具体是基于神经网络中间层正则化的黑盒攻击型防御系统，包括第一源模型、第二源模型和第三源模型；基于神经网络中间层正则化的黑盒攻击型防御方法，包括S1、将图片输入第一源模型进行白盒攻击，输出第一对抗样本序列，S2、将第一对抗样本序列输入到第二源模型中，输出第二对抗样本序列，S3、将第二对抗样本序列输入到第三源模型中进行黑盒攻击，输出第三识别样本序列，S4、将第三识别样本序列输入第三源模型进行对抗训练，更新第三源模型；利用该算法生成的对抗样本具有对目标模型高迁移性的特性，也可以有效的通过对抗训练防御目标模型被攻击。的通过对抗训练防御目标模型被攻击。的通过对抗训练防御目标模型被攻击。

全部详细技术资料下载

【技术实现步骤摘要】
基于神经网络中间层正则化的黑盒攻击型防御系统及方法

[0001]本专利技术涉及人工智能安全领域，具体是指基于神经网络中间层正则化的黑盒攻击型防御系统及方法。

技术介绍

[0002]当对图像信号添加微小扰动，被添加扰动的图像信号输入用于分类任务的卷积神经网络时，会被该网络识别错误，该技术应用广泛，在车辆检测系统中，通过对车牌号图像进行微小扰动的方式欺骗车辆检测系统，有助于提升车辆检测系统鲁棒性和稳健性；在人脸识别检测系统中，通过对人脸图像进行微小扰动的方式欺骗人脸识别检测系统，有助于检验人脸识别网络的鲁棒性和安全性；在无人驾驶系统中，通过对路标图像进行微小扰动的方式欺骗自动驾驶系统，有助于检验机器视觉中物体分类和目标检测网络的稳健性和安全性，随着5G时代的到来，图像视频数据将成为主流网络数据，神经网络攻击生成图像对抗样本技术，在网络对抗领域扮演关键角色，对防御算法性能的提升有着重要作用。
[0003]现在比较常见的攻击方式为黑盒攻击和白盒攻击，其中黑盒攻击分为基于迁移性的训练替代模型攻击方式，以及基于决策的多次查询估计梯度攻击方式，二者在生成接近黑盒模型的替代模型后和估计接近黑盒模型梯度后，利用主流的白盒攻击的方法来进行攻击，前者在训练替代模型时多数需要得知被攻击模型的训练数据集，以及输入输出等除模型内部参数以外的众多信息，而这些信息特别是训练数据集在实际应用中是很难得知的，或者是被限制获取数量的，所以通过以上方式生成替代模型的方法在很多情况下是有所限制的，后者通过对对抗模型多次进行查询输入输出并且估计梯度，当...

【技术保护点】

【技术特征摘要】
1.基于神经网络中间层正则化的黑盒攻击型防御系统，其特征在于：包括第一源模型，用于输出第一对抗样本序列；第二源模型，用于输出第二对抗样本序列；第三源模型，用于输出第三识别样本序列，并将第三识别样本序列输入第三源模型进行对抗训练，更新第三源模型。2.根据权利要求1所述的基于神经网络中间层正则化的黑盒攻击型防御系统，其特征在于：所述第一源模型和第二源模型采用以残差模块为基础的ResNet网络，第三源模型采用DenseNet网络，所述第二源模型划分不同的神经网络结构层，所述第二源模型的每一层均加入正则化损失函数。3.基于神经网络中间层正则化的黑盒攻击型防御方法，采用权利要求1～2所述的基于神经网络中间层正则化的黑盒攻击型防御系统，其特征在于：包括S1、将图片输入第一源模型进行白盒攻击，输出第一对抗样本序列；S2、将第一对抗样本序列输入到第二源模型中，在第二源模型的每一层均利用正则化损失函数对第一对抗样本序列进行攻击，输出第二对抗样本序列；S3、将第二对抗样本序列输入到第三源模型中进行黑盒攻击，输出第三识别样本序列；S4、将第三识别样本序列输入第三源模型进行对抗训练，更新第三源模型。4.根据权利要求3所述的基于神经网络中间层正则化的黑盒攻击型防御方法，其特征在于：所述步骤S2中，正则化损失函数对第一对抗样本序列进行攻击包括如下两...

【专利技术属性】
技术研发人员：李晓锐，崔炜煜，王文一，陈建文，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人