一种基于网络防御的模型处理方法、装置及存储介质制造方法及图纸

技术编号：29674190 阅读：14 留言：0更新日期：2021-08-13 21:56

本申请公开了一种基于网络防御的模型处理方法、装置及存储介质，涉及神经网络的防御方法，包括：获取与目标模型满足相似度要求的替代模型；采用预设攻击方式攻击替代模型，生成对抗样本；根据对抗样本以及预设算法，计算获取差分隐私噪声参数；根据差分隐私噪声参数，在目标模型的输出层添加差分隐私噪声层，获取优化的目标模型。在该方法中，通过攻击替代模型生成对抗样本，并利用对抗样本以及预设算法，计算获取差分隐私噪声参数；最终在目标模型的输出层添加差分隐私噪声层，得到了优化后的目标模型，由于替代模型和目标模型的决策边缘相似，攻击替代模型生成的对抗样本具有较好的迁移性，提高了目标模型对抗各种攻击的成功率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于网络防御的模型处理方法、装置及存储介质
本专利技术涉及神经网络的防御方法，具体涉及一种基于网络防御的模型处理方法、装置及存储介质。
技术介绍
深度学习(DeepLearning，简称DL)是机器学习(MachineLearning，简称ML)的一个分支，通过使计算机从经验和知识中学习而不需要明确的编程，并从原始数据中提取有用的模式的机器学习方法。对于传统的机器学习算法，由于其局限性，例如维度诅咒、计算瓶颈等，难以提取出表征良好的特征。深度学习通过构建多个简单的特征来表示一个复杂的概念来解决表示问题。例如，一个基于深度学习的图像分类系统通过描述隐藏层中的边缘和结构来表示一个对象。随着可用训练数据的增加，深度学习的性能变得更加强大。深度学习模型借助硬件加速计算时间，已经可以解决许多复杂问题。目前，随着深度学习的发展，深度神经网络(DeepNeuralNetworks，简称DNN)已经在很多领域可以达到优于人类的效果，例如计算机视觉、语音识别、自然语言处理、机器翻译、自动驾驶等领域。然而伴随着DNN在众多领域被应用，最近也很多研究开始关注DNN的安全性。目前已经有很多在深度学习领域的工作表明DNN在对抗样本中的潜在脆弱性。在图像分类中，对抗样本是一个经过精心修改的图像，人类的视觉对扰动并不敏感(人眼难以发现对抗样本与其对应原始图像的区别)，但对抗样本却可能导致DNN模型对其误分类。比如，通过在一张猫的图像上加特定的噪声生成对抗样本，在人看来，生成的对抗样本并无区别，还是一只猫。但是如果将对抗样本输入一个已经...

【技术保护点】
1.一种基于网络防御的模型处理方法，其特征在于，包括：/n获取与目标模型满足相似度要求的替代模型；/n采用预设攻击方式攻击所述替代模型，生成对抗样本；/n根据所述对抗样本以及预设算法，计算获取差分隐私噪声参数；/n根据所述差分隐私噪声参数，在所述目标模型的输出层添加差分隐私噪声层，获取优化的目标模型。/n

【技术特征摘要】
1.一种基于网络防御的模型处理方法，其特征在于，包括：
获取与目标模型满足相似度要求的替代模型；
采用预设攻击方式攻击所述替代模型，生成对抗样本；
根据所述对抗样本以及预设算法，计算获取差分隐私噪声参数；
根据所述差分隐私噪声参数，在所述目标模型的输出层添加差分隐私噪声层，获取优化的目标模型。

2.根据权利要求1所述的基于网络防御的模型处理方法，其特征在于，所述获取与目标模型满足相似度要求的替代模型，包括：
根据所述目标模型的输出类型，搭建初始替代模型；
将待分类数据输入所述目标模型，输出获取所述待分类数据对应的标记信息；
根据所述待分类数据对应的标记信息以及所述待分类数据，获取训练数据集；
采用所述训练数据集训练所述初始替代模型，获取所述替代模型。

3.根据权利要求2所述的基于网络防御的模型处理方法，其特征在于，所述采用预设攻击方式攻击所述替代模型，生成对抗样本，包括：
采用白盒攻击方法攻击所述替代模型，生成所述对抗样本。

4.根据权利要求1所述的基于网络防御的模型处理方法，其特征在于，所述根据所述对抗样本以及预设算法，计算获取差分隐私噪声参数，包括：
采用公式计算获取差分隐私噪声参数
其中，i表示所述目标模型的第i类样本，j表示所述目标模型的第j类样本，x表示所述目标模型的测试样本数，ε为隐私保护预算，C表示目标模型数据集的类别数，f(i)(x)表示所述目标模型的测试样本x被所述目标模型分类为第i类的概率，e表示自然底数，s(f,||·||)表示得分函数f(·)的敏感度，定义为：

其中，z表示所述目标模型的样本，z′表示所述对抗样本，f(i)(z)表示输入为数据样本z、输出为第i类样本时的输出概率，f(i)(z′)表示输入为数据样本z′、输出为第i类样本时的输出概率，zi、zj表示同一类别的不同样本，p表示范数，ρ表示常数。

5.根据权利要求1所述的基于网络防御的模型处理方法，其特征...

【专利技术属性】
技术研发人员：陈晋音，上官文昌，吴长安，宣琦，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人