基于样本到决策边界距离的对抗样本检测方法技术

技术编号：20045849 阅读：36 留言：0更新日期：2019-01-09 04:27

一种基于样本到决策边界距离的对抗样本检测方法，根据普通样本生成对抗样本，并要对所有样本进行特征提取，即计算每个样本到决策边界的距离估计值，然后把距离估计值作为样本的特征对分类器进行训练，训练后的分类器即为检测器，用于检测对抗样本。本发明专利技术能够广泛应用于基于分类器的机器学习模型，如语音识别、图像分类等多个领域，提高对抗样本检测率。用于人工智能API，可以对输入样本进行过滤，对人工智能的安全性有明显提升。

全部详细技术资料下载

【技术实现步骤摘要】
基于样本到决策边界距离的对抗样本检测方法
本专利技术涉及的是一种人工智能对抗领域的技术，具体是一种基于样本到决策边界距离的对抗样本检测方法。
技术介绍
人工智能近年来飞速发展，也被应用在越来越多的领域。但是，研究发现人工智能分类器存在比较严重的安全漏洞，恶意攻击者可以通过对正常的识别样本进行微小扰动，使其成为对抗样本，对抗样本可以使分类器识别出错，使用对抗性训练能在一定程度上抵抗对抗样本攻击，但是效果总是不能令人满意，于是，很多研究者希望通过对抗样本的一些固有特性来检测出对抗样本，从而抵抗对抗性攻击。
技术实现思路
本专利技术针对对抗样本攻击，提出一种基于样本到决策边界距离的对抗样本检测方法，以样本到决策边界的距离作为样本的特征，以是否为对抗样本作为分类标签，训练一个分类器，将此分类器作为对抗样本检测器。本专利技术针对人工智能对抗攻击，能够广泛应用于基于分类器的机器学习模型，如语音识别、图像分类等多个领域，提高对抗样本检测率。用于人工智能API，可以对输入样本进行过滤，对人工智能的安全性有明显提升。本专利技术是通过以下技术方案实现的：本专利技术根据普通样本生成对抗样本，并要对所有样本进行特征提取，即计算每个样本到决策边界的距离估计值，然后把距离估计值作为样本的特征对一个分类器进行训练，训练后的分类器即为检测器，用于检测对抗样本。所述的对抗样本，通过多种对抗样本生成方式生成后等比例混合得到，其生成方法包括迭代的快速梯度下降算法(iter-FGSM)、基于优化的对抗样本距离计算方法(C&W)、迷惑深度学习方法(DeepFool)、基于雅各比矩阵的贪婪匹配算...

【技术保护点】
1.一种基于样本到决策边界距离的对抗样本检测方法，其特征在于，根据普通样本生成对抗样本，并要对所有样本进行特征提取，即计算每个样本到决策边界的距离估计值，然后把距离估计值作为样本的特征对分类器进行训练，训练后的分类器即用于检测对抗样本。

【技术特征摘要】
1.一种基于样本到决策边界距离的对抗样本检测方法，其特征在于，根据普通样本生成对抗样本，并要对所有样本进行特征提取，即计算每个样本到决策边界的距离估计值，然后把距离估计值作为样本的特征对分类器进行训练，训练后的分类器即用于检测对抗样本。2.根据权利要求1所述的方法，其特征是，所述的对抗样本，通过多种对抗样本生成方式生成后等比例混合得到，其生成方法包括迭代的快速梯度下降算法、基于优化的对抗样本距离计算方法、迷惑深度学习方法、基于雅各比矩阵的贪婪匹配算法。3.根据权利要求1所述的方法，其特征是，所述的特征提取，先对所有样本进行无效样本剔除，其中无效样本包括正常样本中被分类错误的样本，以及无法愚弄分类器(即未跨过决策边界)的对抗样本。4.根据权利要求1所述的方法，其特征是，所述的分类器通过神经网络实现，具体包括：全连接层和Dropout层。5.根据权利要求1所述的方法，其特征是，所述的距离估计值，通过距离上界distU和距离下界distL限制其范围，通过对距离上下界的估计从而把样本到决策边界的距离缩小到一个比较精确的范围，即[distL，distU]，...

【专利技术属性】
技术研发人员：易平，胡嘉尚，张浩，倪洁，何芷珊，胡又佳，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人