一种十字形的对抗补丁攻击方法技术

技术编号：36878441 阅读：18 留言：0更新日期：2023-03-15 20:56

本发明专利技术涉及深度神经网络领域，且公开了一种十字形的对抗补丁攻击方法，基于十字形的对抗补丁攻击通过将扰动区域限制为十字形来进行攻击。在以往的攻击中，大部分攻击只考虑对抗补丁的位置和内容，而很少考虑对抗补丁的形状，对抗补丁被默认为是矩形的。基于这个发现，本发明专利技术通过改变对抗补丁的形状来进行对抗补丁攻击。首先我们对对抗补丁的内容进行初始化，并在原始图像中随机位置处覆盖该对抗补丁，从而形成初始候选样本。然后迭代地优化对抗补丁的内容和位置。本发明专利技术基于一个特殊的分布来使用随机搜索的策略来进行候选对抗补丁的生成。大量的实验结果证明了本发明专利技术的优越性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
一种十字形的对抗补丁攻击方法

[0001]本专利技术涉及深度神经网络领域，具体为一种十字形的对抗补丁攻击方法。

技术介绍

[0002]深度神经网络已在许多领域显示出显著的成功，如图像分类、自然语言处理、数据挖掘等。尽管深度神经网络取得了很大的成就，但最近的研究表明，深度神经网络很容易受到对抗样本的影响。也就是说说，已经训练好的模型会对精心制作的对抗对抗样本进行错误分类，这种对抗样本通过在原始图像上添加不易察觉的扰动而产生的。因此，深度神经网络在安全领域的应用受到限制，如自动驾驶的交通标志识别、门禁系统和其他关键任务。因此，对抗性攻击和防御已经成为近年来的研究热点。
[0003]根据受害者模型的不同，对抗攻击可以分为白盒攻击和黑盒攻击。这两种攻击的区别在于受害模型的泄漏信息种类，对于白盒攻击，攻击者获得了关于受害者模型的所有信息，包括架构、参数等等。因此，在这种情况下，对抗样本可以很容易地通过反向传播产生。对于黑盒攻击，只允许攻击者查询受害模型并接收相应的预测结果。这种设置是最具挑战性的，但也是最实用的，因为攻击方在现实中几乎没有机会知道关于受害模型的所有信息。黑盒攻击进一步可分为基于迁移的攻击和基于查询的攻击。
[0004]经典的工作大多数主要是密集攻击，即对原始图像的所有像素进行不可察觉的扰动。然而，这种对抗性的例子在现实世界中很难制造。与改变整个图像不同，稀疏攻击的重点是用可感知的扰动来改变原始图像极少数的像素且不改变图像原本的语义来进行攻击。更重要的是，这种扰动可以很容易地在物理世界中打印出来。

【技术保护点】

【技术特征摘要】
1.一种十字形的对抗补丁攻击方法，其特征在于，包括以下步骤：第一步：迭代地在水平条状或垂直条状的随机位置上覆盖一小段连续的单色块，从而生成初始化补丁的内容，对抗补丁覆盖在原图的某个随机位置，该随机位置由十字形补丁的交点坐标(i，j)确定，使用映射函数生成位置掩码m，将改扰动图像送入受害模型进行查询，得到模型返回的关于这张扰动图像的置信度，进而通过损失函数计算出初始loss值，记为当前最佳损失loss
best
；第二步：迭代地对对抗补丁的内容δ和位置δ进行更新；第三步：每一次迭代需要采样新的对抗补丁或者内容；第四步：基于损失函数来判断迭代更新中通过随机采样而形成的新的候选对抗补丁是否更优，如果损失值变小了，该候选对抗补丁将被保留，即更新了对抗补丁，否则将不保留此次对抗补丁，会进下一次迭代；第五步：基于十字形的白盒对抗补丁攻击。2.根据权利要求1所述的一种十字形的对抗补丁攻击方法，其特征在于：所述第一步映射函数：3.根据权利要求1所述的一种十字形的对抗补丁攻击方法，其特征在于：所述第二步包括以下内容：设置采样候选位置的迭代间隔t，每一次迭代从一个特殊的采样分布中采样一个新的对抗补丁的内容δ
new
和位置m
new
构造新的扰动图像，并通过查询受害模型计算出新的损失值loss
new
，如果新的损失值loss
new
小于当前最佳损失loss
best
，那么新的对抗补丁的内容或者位置保存为当前所能找到的最佳解，并将该新的损失值loss

【专利技术属性】
技术研发人员：王员根，冉钰，
申请(专利权)人：广州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人