一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法技术

技术编号：21631713 阅读：26 留言：0更新日期：2019-07-17 11:59

本发明专利技术公开了一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法,相较于以往用于攻击神经网络的对抗性图像生成方法，本方法考虑生成样本的不可见性，通过多尺度区域复杂度融合搜索图像的复杂区域，并自适应地在复杂区域加入生成的噪声，实现高隐蔽性的对抗性图像攻击。此外，本方法具有高扩展性，可以与现有的对抗性图像攻击方法相结合，在不影响攻击成功率的条件下，生成面向深度神经网络的不可见性更高的对抗性图像。

A Spatial Constraint-Based Hidden Anti-image Attack Method for Depth Neural Network

全部详细技术资料下载

【技术实现步骤摘要】
一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法
本专利技术涉及一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法，属于人工智能安全领域。
技术介绍
近年来，深度学习技术发展迅速，深度神经网络在各种领域展现出接近甚至超过人类的表现，如：图像分类、目标检测、自然语言处理等。因此，深度神经网络被广泛地用于解决各类实际任务，如无人驾驶、语音识别、智能监控等。然而近期研究表明深度神经网络对于特定的攻击十分脆弱：将输入图像加上精心构建的人类难以察觉的噪声，深度神经网络会输出错误甚至攻击者期望的结果，这类修改后的输入称之为对抗性图像。这类对抗性图像对于深度神经网络具有极高的攻击成功率，且具有可转移性：通过特定的网络生成的对抗性图像可以攻击一系列的网络结构。这类对抗性图像攻击给基于深度学习技术的安全敏感应用带来了巨大的威胁。然而，通过对现有对抗性图像算法进行研究，我们发现生成的对抗性图像并没有达到高隐蔽性：观察者可以在图像上找到攻击者添加的噪声。这会造成对抗样本与原始图像有较大的差异，从而引起观察者的怀疑，认为图像被攻击者蓄意修改。由于一张图像中不同的区域复杂程度不同，而现有的攻击算法在生成噪声的时候对每一个像素采取同样的策略，这会导致在复杂程度相对低的区域加上了过量噪声，使得生成的对抗性图像容易被人眼所分辨。低隐蔽性的对抗性图像虽然能够达到高攻击成功率，但很容易被受过训练的观察者所察觉，并及时阻止攻击的发动。本专利技术认为现有的对抗性图像生成方法仅仅满足对深度神经网络的高攻击成功率，在不可见性上表现很差，使得对抗性图像引起观察者的怀疑，无法实...

【技术保护点】
1.一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法，其特征在于，包含如下步骤：步骤1、给定一个图像分类器，输入原始图像，该分类器输出图像的类别以及分类到每一个类别的概率；攻击者能够访问目标模型的参数和权重，并设定给定图像的目标类别；步骤2、考虑图像对比度、能量、同质性、边缘密度和压缩比，提出衡量图像区域复杂度的函数；通过该函数来确定给定图像不同尺度下图像复杂的区域；步骤3、为了确定给定图像加噪声区域，提出细粒度图像复杂区域搜索算法，将不同尺度下的复杂区域进行融合，得到最终的满足添加噪声不被人眼察觉的复杂区域；步骤4、与现有的对抗性图像生成算法结合，仅在确定的复杂区域对图像进行修改，得到基于空间约束的并对抗性图像生成方法，生成高隐蔽性对抗性图像，使目标模型分类到目标类别。

【技术特征摘要】
1.一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法，其特征在于，包含如下步骤：步骤1、给定一个图像分类器，输入原始图像，该分类器输出图像的类别以及分类到每一个类别的概率；攻击者能够访问目标模型的参数和权重，并设定给定图像的目标类别；步骤2、考虑图像对比度、能量、同质性、边缘密度和压缩比，提出衡量图像区域复杂度的函数；通过该函数来确定给定图像不同尺度下图像复杂的区域；步骤3、为了确定给定图像加噪声区域，提出细粒度图像复杂区域搜索算法，将不同尺度下的复杂区域进行融合，得到最终的满足添加噪声不被人眼察觉的复杂区域；步骤4、与现有的对抗性图像生成算法结合，仅在确定的复杂区域对图像进行修改，得到基于空间约束的并对抗性图像生成方法，生成高隐蔽性对抗性图像，使目标模型分类到目标类别。2.如权利要求1所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法，其特征在于：目标图像分类器可以表示为f(x，θ)＝y，其中x为模型输入的图像，θ为模型参数，y为模型输出，即对输入图像x的类别预测；模型输出倒数第二层被称作logits层，输出原始图像对应的每种类别的置信度；而最后一层称作softmax层，输出logits层结果归一化后的结果,即分类到每种类别的概率；分类器最后的输出y即为softmax层的最大值，表示为：f((x,θ))＝max(softmax(logits(x)))＝y攻击者以一个训练好的基于神经网络图像分类器为攻击目标，对目标模型具有白盒访问权限，即能够访问目标模型的参数和权重，并对给定图像设定目标类别，生成高隐蔽性对抗性图像使得目标模型将其分类到目标类别。3.如权利要求1所述的一种面向深度神经网络的基于空间约束的高隐蔽性对抗性图像攻击方法，其特征在于：计算给定图像的不同尺度下的区域复杂度，计算图像的对比度、能量、同质性、边缘密度和压缩比，用M1～M5来表示；将各项指标进行线性组合，得到图像区域复杂度函数：其中g为图像划分的一个单位区域，ωi为对应指标Mi的系数，n取值为5；我们选取对比度、能量、同质性、边缘密度以及压缩比5个图像复杂度指标，分别计算在大尺度下和小尺度下的图像区域复杂度；对比度通过计算每个像素与相邻像素之间的对比度总和得到；能量为图...

【专利技术属性】
技术研发人员：王志波，郑思言，宋梦凯，王骞，
申请(专利权)人：武汉大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人