一种基于噪声压缩的可迁移的非黑盒攻击对抗方法技术

技术编号：21572058 阅读：40 留言：0更新日期：2019-07-10 15:32

本发明专利技术公开了一种基于噪声压缩的可迁移的非黑盒攻击对抗方法，步骤1、构建VGG16待攻击神经网络模型及相应的参数配置文件；步骤2、给定待攻击的原始图片x,并指定错分的目标类别；步骤3、收集若干张目标类别的图片，将这些图片输入待攻击神经网络模型中，选取能够被正确分类的图片构成图像集合TargetImg；步骤4、利用二分插值法初步找到对抗样本；步骤5、找到噪声幅度更小的对抗样本；步骤6、进行分组降噪处理；步骤7、进行随机降噪处理，得到最终的对抗样本。与现有技术相比，本发明专利技术在实现非黑盒攻击的对抗能够更加简单高效且快速，相比于经典的“基于迭代的快速梯度符号法”算法在性能方面有显著的提高；生成的对抗样本在非黑盒攻击下更具有鲁棒性。

A Movable Non-Black Box Attack Countermeasure Method Based on Noise Compression

全部详细技术资料下载

【技术实现步骤摘要】
一种基于噪声压缩的可迁移的非黑盒攻击对抗方法
本专利技术涉及图像分类
，尤其是涉及一种非黑盒攻击的对抗方法。
技术介绍
随着人工智能的发展，在计算机视觉和多媒体领域中，特别是随着数字图片的急速增长，无论是从学术界还是在工业界对于图片进行精准的分类任务都是一个非常重要和具有挑战性的任务。在现实生活中对于图像分类器的应用不计其数，例如人脸识别、异常行为检测等等。人类的生活已经对其产生了非常强的依赖性。但是随着人工智能进一步向前发展的同时，也需要进行思考。在过去的几年中已经涌现出了各种各样的图像分类方法，特别是最近几年深度学习在计算机智能领域的异军突起。使得用深度神经网络提取图片的特征表示成表示了一种主流方向。但是深度神经网络在一定程度上更像是一个黑盒，某种程度上具有不可解释性，所以这也带了不可忽视的安全隐患。随着研究的深入，谷歌大脑的研究人员首次在图片中增加人类视觉很难辨认的噪声，这种增加了噪声的图片可以使分类器错分，而这种增加了噪声的图片就是对抗样本。对抗样本尤其对基于深度神经网络的分类器效果更表示明显。对于分类器的错分分表示两种：针对性错分和非针对性错分。在这两者中，针对性错分具有更高的难度。根据攻击者对于目标模型和数据集的相关知识了解程度，攻击分类被分为白盒攻击、非黑盒(灰盒)攻击和黑盒攻击。最开始对抗攻击的研究基于白盒攻击，在这种设定下，攻击者能够充分获取目标模型的网络内部结构和数据集的相关知识，但是这种对抗攻击往往只具有理论价值而缺乏实际价值。之后研究者开始探究非黑盒(灰盒)攻击和黑盒的对抗攻击，该对抗攻击是指攻击者无法获取目标模型的内部知识或...

【技术保护点】
1.一种基于噪声压缩的可迁移的非黑盒攻击对抗方法，其特征在于，该方法包括以下步骤：步骤1、构建VGG16待攻击神经网络模型及相应的参数配置文件，采用github上的开源框架foolbox进行封装；步骤2、给定一张待攻击的原始图片x，并指定错分的目标类别；步骤3、收集若干张目标类别的图片，将这些图片输入待攻击神经网络模型中，选取输出类别与目标类别一致的图片构成图像集合TargetImg，公式如下：TargetImg＝{Target1，…，TargetN}，其中，N表示集合TargetImg中的图像总数；步骤4、利用二分插值法初步找到对抗样本：首先，采用二分插值法在每张目标类别的图片Targeti中寻找各图片Targeti的最优对抗样本共N张，再从该N张对抗样本中选取最优的对抗样本Target0，其中评价对抗样本的优劣是利用l2范数，即原图与对抗样本的差的二范数；步骤5、利用“针对性错分下的基于迭代的快速梯度符号法”算法找到噪声幅度更小的对抗样本，具体公式如下：

【技术特征摘要】
1.一种基于噪声压缩的可迁移的非黑盒攻击对抗方法，其特征在于，该方法包括以下步骤：步骤1、构建VGG16待攻击神经网络模型及相应的参数配置文件，采用github上的开源框架foolbox进行封装；步骤2、给定一张待攻击的原始图片x，并指定错分的目标类别；步骤3、收集若干张目标类别的图片，将这些图片输入待攻击神经网络模型中，选取输出类别与目标类别一致的图片构成图像集合TargetImg，公式如下：TargetImg＝{Target1，…，TargetN}，其中，N表示集合TargetImg中的图像总数；步骤4、利用二分插值法初步找到对抗样本：首先，采用二分插值法在每张目标类别的图片Targeti中寻找各图片Targeti的最优对抗样本共N张，再从该N张对抗样本中选取最优的对抗样本Target0，其中评价对抗样本的优劣是利用l2范数，即原图与对抗样本的差的二范数；步骤5、利用“针对性错分下的基于迭代的快速梯度符号法”算法找到噪声幅度更小的对抗样本，具体公式如下：其中，x′0表示第(4)步找到的对抗样本Target0，x表示原始图片，表示交叉熵损失函数对于图片x的导数，求导法...

【专利技术属性】
技术研发人员：韩亚洪，王思宇，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人