一种基于VAE-GAN的对抗样本防御方法及系统技术方案

技术编号：25442316 阅读：196 留言：0更新日期：2020-08-28 22:29

本发明专利技术属于对抗样本防御技术领域，公开了一种基于VAE‑GAN的对抗样本防御方法及系统，使用变分自动编码器VAE和生成对抗网络GAN对对抗样本进行去噪，VAE作为分类器的预处理模型对对抗样本进行去噪处理，GAN用于辅助VAE的训练，使得VAE输出的图像结果更加接近于原始无噪声的图像。本发明专利技术提供的基于VAE‑GAN的对抗样本防御方法属于输入预处理，可在不同分类模型之间学习迁移；无需重新训练原有分类网络，训练成本较低；几乎不影响原始无噪声样本分类精度；不需要使用对抗样本，所以无需而外的训练对抗样本；对噪声较小的对抗样本防御效果也很好；预处理速度快且输出图像质量接近于原始无噪声图像。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于VAE-GAN的对抗样本防御方法及系统
本专利技术属于对抗样本防御
，尤其涉及一种基于VAE-GAN的对抗样本防御方法及系统。
技术介绍
目前，深度神经网络在许多传统机器学习难以解决的问题上有着优秀的表现。随着深度神经网络模型的不断完善，越来越多的深度学习解决方案慢慢的进入人们的日常生活，比如：图形识别，人脸识别，自动驾驶，语音指令识别等。尽管深度神经网络在各领域有着优秀的表现，但Szegedy等人证明现代深度神经网络非常容易受到对抗样本的攻击，这些对抗样本仅仅是在原始图片上添加细微扰动(人类视觉无法察觉)，就能导致深度神经网络模型对图像的错误分类(如图5所示)。目前深度神经网络对抗攻击的手段越来越多，攻击所需的扰动也越来越小，传统对图像的去噪及降低深度神经网络过拟合程度的方法已经无法防御这些对抗样本的攻击。并且目前的防御方案存在训练成本大，防御迁移能力差的缺点。目前存在的防御方案分为三个方向：输入预处理，改进神经网络模型以及仅识别是否为对抗样本而不进行处理。目前的防御方案如下：(1)输入预处理：对图像进行压缩重建，对图像进行缩放，降低图像分辨率，对图片进行去噪；(2)改进神经网络模型：限制神经元的输出，在神经网络模型中添加不可微部分，降低神经网络过拟合，以及在训练集中添加对抗样本提高神经网络模型的健壮性。(3)仅识别是否为对抗样本不进行处理：利用svm分辨输入数据是否为对抗样本，使用胶囊网络来分辨输入数据是否为对抗样本。但是，目前的防御方案中，输入预处理会导致输...

【技术保护点】
1.一种基于VAE-GAN的对抗样本防御方法，其特征在于，所述基于VAE-GAN的对抗样本防御方法使用变分自动编码器VAE和生成对抗网络GAN对对抗样本进行去噪，并利用GAN辅助变分自动编码器VAE的训练，使变分自动编码器VAE输出的图像结果接近原始无噪声图像。/n

【技术特征摘要】
1.一种基于VAE-GAN的对抗样本防御方法，其特征在于，所述基于VAE-GAN的对抗样本防御方法使用变分自动编码器VAE和生成对抗网络GAN对对抗样本进行去噪，并利用GAN辅助变分自动编码器VAE的训练，使变分自动编码器VAE输出的图像结果接近原始无噪声图像。

2.如权利要求1所述的基于VAE-GAN的对抗样本防御方法，其特征在于，所述基于VAE-GAN的对抗样本防御方法包括以下步骤：
步骤一，选择合适的网络结构构建VAE-GAN训练网络；
步骤二，对VAE-GAN网络进行训练；
步骤三，使用VAE-GAN模块作为分类器预处理模块防御对抗样本的攻击。

3.如权利要求1所述的基于VAE-GAN的对抗样本防御方法，其特征在于，步骤一中，所述选择合适的网络结构构建VAE-GAN训练网络的方法如下：
选择合适的网络结构构建VAE-GAN训练网络，对于分类器的不同VAE和GAN选择的神经网络结构也不同，对于小的数据集VAE和GAN选择使用DNN结构，对于大的数据集VAE和GAN就需要选择更深的神经网络或者卷积神经网络。

4.如权利要求1所述的基于VAE-GAN的对抗样本防御方法，其特征在于，步骤一中，所述VAE-GAN包含两个部分：VAE部分与GAN部分；VAE主要功能是将输入的图像进行去噪，然后通过GAN使得VAE重建图像分布尽可能的接近原始图像分布；
VAE又可以分为Encoder编码部分以及Decoder解码部分；Encoder主要是将输入的图像样本映射成两组n维矢量，均值矢量...

【专利技术属性】
技术研发人员：何永庆，王海卫，王荣耀，王珂，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人