一种基于集成防御的鲁棒性增强的分类方法及装置制造方法及图纸

技术编号：29331891 阅读：20 留言：0更新日期：2021-07-20 17:49

本发明专利技术属于人工智能科学领域，提供了一种基于集成防御的鲁棒性增强的分类方法及装置，主旨在于解决传统图像去噪、自编码网络去噪和原有蒸馏防御的问题。主要方案包括首先将取自图像的原始数据集经过数据预处理后进行特征提取；然后对图像进行是否是对抗样本的分类检测，主要步骤为将图像分别进行传统图像去噪、深度学习去噪，将原对抗样本和两种去噪图像分三次输入到原始分类模型中进行预测，分别计算两次去噪图像预测的标签概率与原图像预测概率之差，并取差值的最大值，若差值大于某阈值则判别输出为对抗样本，反之则不是；最后对模型进行梯度平滑的鲁棒性增强，鲁棒性增强模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于集成防御的鲁棒性增强的分类方法及装置
本专利技术属于人工智能科学领域，其用途是利用对抗样本检测和模型平滑的集成防御方式对原始网络进行鲁棒性增强，首先用对抗样本检测检测出部分对抗样本，无法正确分类的对抗样本进一步使用梯度平滑后的模型进行正确分类，梯度平滑主要利用了软标签来替代硬标签，最后达到对原始神经网络模型进行鲁棒性增强和区分出对抗样本的效果，同时涉及了一种提升深度神经网络模型鲁棒性的装置。
技术介绍
深度学习是目前研究最活跃的计算机领域之一，其已被证明在很多机器学习的问题上处理表现优异，如人脸识别、图片分类和物品跟踪等。这些深度神经网络(DNN)能够有效地从大量训练样本中学习高度精确的模型，然后以非常高的准确度对看不见的样本进行分类。然而，这种用于分类的模型却极易遭受由攻击者精心设计的对抗样本的攻击，这种攻击能使原始的分类模型的准确率大大下降，甚至能使模型将数据分类为攻击者想要的类别。这种对抗样本对于深度学习的应用产生极大的威胁，引发了相关安全问题的广泛讨论。在此之前有人提出了知识蒸馏的方法，其最初设计是用于使用从不同DNN传输的知识来训练DNN。有研究者基于此制定了一种新的蒸馏变体来提供防御训练：使用从原始DNN中提取的知识来提高其对抗样本的适应能力，而不是在不同的体系结构之间传递知识。但是传统的蒸馏防御技术限制了用于蒸馏的小规模的学生模型的结构，一些扰动较大的对抗样本本身非常难以分类准确，单纯使用学生模型难以提升包含对抗样本的大规模数据集的分类准确率，同时会进一步降低原始干净图像的分类准...

【技术保护点】
1.一种基于集成防御的鲁棒性增强的分类方法，其特征在于：/n数据预处理：计算机获取训练集中的原始训练数据和原始训练数据的真实标签进行预处理，原始训练数据包括多张图像，图像为基本的图像数据集mnist或cifar10数据集，并将原始训练数据集通过对抗样本生成算法fgsm、BIM、CW生成原始对抗样本，最后输入到分类检测的原始图像数据包括原始训练数据和原始对抗样本数据；/n对抗样本去噪：将预处理后的原始图像数据分别进行图像位数压缩去噪和深度学习自编码网络去噪，得到去噪后的原始训练数据和原始对抗样本数据；/n对抗样本分类预测：将原始图像数据和去噪后的原始训练数据和原始对抗样本数据分三次输入到原始分类模型中进行预测，得到图像的预测值p

【技术特征摘要】
1.一种基于集成防御的鲁棒性增强的分类方法，其特征在于：
数据预处理：计算机获取训练集中的原始训练数据和原始训练数据的真实标签进行预处理，原始训练数据包括多张图像，图像为基本的图像数据集mnist或cifar10数据集，并将原始训练数据集通过对抗样本生成算法fgsm、BIM、CW生成原始对抗样本，最后输入到分类检测的原始图像数据包括原始训练数据和原始对抗样本数据；
对抗样本去噪：将预处理后的原始图像数据分别进行图像位数压缩去噪和深度学习自编码网络去噪，得到去噪后的原始训练数据和原始对抗样本数据；
对抗样本分类预测：将原始图像数据和去噪后的原始训练数据和原始对抗样本数据分三次输入到原始分类模型中进行预测，得到图像的预测值p1，压缩去噪图像预测值p2和自编码网络去噪预测值p3；
对抗样本分类检测：分别计算压缩去噪图像预测值p2和自编码网络去噪预测值p3与原始干净图像的预测值p1之差，即p3和p1的差值d2，p2和p1的差值d1，取差值d2和d1中的最大值，若差值大于给定阈值则判别输入为对抗样本，反之则不是；
模型增强：经检测后的图像数据无法保证将对抗样本进行完全的分类，被分类为非对抗样本的图像数据中仍然可能包含一定数量的对抗样本，这些样本需要依靠模型进行自动正确分类，对模型进行进一步的鲁棒性增强从而增加正确分类对抗样本的概率，对教师神经网络进行知识蒸馏，将教师神经网络的知识迁移到小规模低复杂度的学生模型，利用得到的第二次概率分布向量对学生模型进行训练得到最终的鲁棒性增强模型；
鲁棒性增强模型分类：将分类检测中分类为非对抗样本的图像输入鲁棒性增强模型进行分类，提高模型对于对抗样本的防御能力。

2.根据权利要求1所述的一种基于集成防御的鲁棒性增强的分类方法，其特征在于：图像进行图像位数压缩去噪的具体步骤如下：
首先将图像的输入像素值乘以2i-1，并取整，i指i位图像；
将该整数归一化至[0，1]，并除以2i-1；
通过整数舍入运算，将i位图像压缩至低于i位图像。

3.根据权利要求1所述...

【专利技术属性】
技术研发人员：张小松，牛伟纳，丁康一，周杰，李信强，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人