【技术实现步骤摘要】
一种图像分类对抗样本防御方法、系统及数据处理终端
[0001]本专利技术属于人工智能
,尤其涉及一种图像分类对抗样本防御方法、系统及数据处理终端。
技术介绍
[0002]近年来,以深度神经网络模型为基础的深度学习技术快速发展,在现实世界的许多领域中都得到了广泛的应用,例如:计算机视觉、自然语言处理、自动驾驶等。在这些传统方法难以建模和处理的任务中,深度神经网络模型都展现出了十分卓越的性能。
[0003]然而,随着深度学习技术的广泛应用,智能系统的安全性逐渐开始引起人们的关注。最近的研究表明,深度神经网络模型容易受到来自对抗样本的攻击而输出错误的预测结果。Szegedy等人于2014年首先发现了可以通过在输入中添加极其微小的扰动,误导神经网络分类模型以极高的置信度输出错误的预测结果,这激发了针对深度学习对抗性攻击和防御的广泛研究。在此基础上,Carlini和Wagner提出了一种攻击性能非常强的对抗样本生成方法,能够以较小的代价和较高的成功率欺骗深度神经网络模型,在其基础上进行改进,增加新的约束,还可以成功绕过许多种对抗样本防御装置。后来,Moosavi
‑
Dezfooli等人发现,可以制作一个“通用扰动”,使用一次性生成的对抗性噪声就可以作用于多张图片成功欺骗深度神经网络分类模型。更进一步地,Athalye等人证明,3D打印的真实世界物体可以在现实世界中欺骗基于深度神经网络的目标检测系统。对抗样本的存在给基于深度学习技术设计的人工智能系统带来了巨大的隐患,特别是在对安全性要求较高的领域 ...
【技术保护点】
【技术特征摘要】
1.一种图像分类对抗样本防御方法,其特征在于,所述图像分类对抗样本防御方法包括:利用对抗降噪网络对输入图像进行降噪预处理,获取重建图像;利用目标分类模型获取重建图像的预测类别概率分布;利用目标分类模型获取原始输入图像的预测类别概率分布;计算输入图像的对抗性评分,并根据阈值确定输入图像为对抗样本或良性样本;如果输入图像被判定为对抗样本,则输出重建图像的类别预测结果;反之,如果输入图像被判定为良性样本,则输出原始图像的类别预测结果。2.如权利要求1所述图像分类对抗样本防御方法,其特征在于,所述图像分类对抗样本防御方法包括以下步骤:步骤一,利用对抗降噪网络对输入图像进行预处理,得到重建图像;步骤二,将重建图像输入至目标分类模型,获取分类模型关于重建图像的预测类别概率分布;步骤三,将未经对抗降噪网络预处理的原始图像输入至目标分类模型,获取分类模型关于原始输入图像的预测类别概率分布;步骤四,利用重建图像与原始图像之间的视觉重建误差和类别重建误差,计算输入图像的对抗性评分;步骤五,根据输入图像的对抗性检测结果,输出其分类结果。3.如权利要求2所述图像分类对抗样本防御方法,其特征在于,步骤一中,所述对抗降噪网络,使用基于边缘特征增强的降噪网络作为主干,使用视觉和类别双引导的对抗损失函数作为训练目标,优化降噪网络的参数,使用在干净的良性样本图片上添加高斯白噪声得到的噪声图像训练得到;其中,所述基于边缘特征增强的降噪网络,使用边缘特征增强模块EFE
‑
Block和多尺度特征提取模块MSF
‑
Block为基础,在编码阶段结合使用降采样操作,在解码阶段结合使用上采样操作,在网络中间层之间使用长跳跃连接,构建形成降噪自编
‑
解码网络。4.如权利要求3所述图像分类对抗样本防御方法,其特征在于,所述边缘特征增强模块EFE
‑
Block,包括:将输入张量分为三个计算流处理,包括高斯平滑流、边缘特征增强流和卷积流;在高斯平滑流中,输入张量依次经Gaussian Blur操作、Convolution操作、Batch Norm操作和Leaky ReLU激活单元后输出;在边缘特征增强流中,输入张量依次经过Edge Detection操作、Convolution操作、Batch Norm操作和Leaky ReLU激活单元后输出;在卷积流中,输入张量经过Convolution操作、Batch Norm操作和Leaky ReLU激活单元后输出;使用Concatenate操作将三个张量计算流的输出结果拼接,使用Convolution操作压缩通道数量,输出计算结果;所述多尺度特征提取模块MSF
‑
Block,包括:将输入张量划分为多个计算流进行处理;在每个张量计算流中,分别依次包括Convolution操作、Batch Norm操作和Leaky ReLU激活单元,而在不同的张量计算流中,适当地选用不同尺寸的卷积核,提取不同尺度的特征信息;使用Concatenate操作,将多个张量计算流得到的多通道特征进行拼接,使用1
×
1的卷积核进行Convolution操作,利用自适应提取和保留多通道特征图中有用的特征信息。5.如权利要求2所述图像分类对抗样本防御方法,其特征在于,步骤一中,所述对抗降
噪网络,使用视觉和类别特征双引导的损失函数作为优化目标进行训练;其中,基于视觉和类别特征双引导的损失函数包括视觉特征相似度损失项和类别特征相似度损失项;其中,所述视觉特征相似度损失项为:||x
‑
D(x
′
)||
p
;其中,x表示干净的训练样本;x
′
=x+n
σ
表示添加噪声后的噪声图像,n
σ
表示强度为σ的加性高斯白噪声;D(
·
)表示降噪网络;||x
‑
D(x
′
)||
p
使用p
‑
范数衡量降噪后的图像与原始无噪声图像之间的视觉相似度,该惩罚项指导降噪网络去除视觉域中的不良噪声;所述类别特征相似度损失项为:KL(C(x)||C(D(x
′
));其中,C(
·
)表示目标分类模型,用于获取降噪后的重建图像D(x
′
)和原始图像x的预测类别概率分布,即SoftMax层的输出向量;KL(p||q)表示两个分布p和q之间的Kullback
‑
Leibler散度,衡量两个分布之间的差异,KL(C(x)||C(D(x
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。