一种基于决策分数的图像对抗样本检测方法和系统技术方案

技术编号：34404082 阅读：65 留言：0更新日期：2022-08-03 21:47

本发明专利技术提出一种基于决策分数的图像对抗样本检测方法和系统。其中，方法包括：获取图像数据集并进行预处理，使用不同的模型结构对不同的数据集进行训练，选取各模型中的特定层以计算神经元的决策分数，针对不同的数据集，分别搭建不同的二元分类器，再应用各模型中的特定层计算出的决策分数，训练不同数据集对应的二元分类器，将对抗样本和良性样本的决策分数输入到训练好的二元分类器中进行测试，若分类精度不足，对二元分类器进行优化。本发明专利技术提出的方案，从模型内部神经元出发，通过少量样本计算模型的决策分数，训练简单的二元分类器，利用良性样本和对抗样本的决策分数差异，实现对抗样本的高精度、低成本检测。低成本检测。低成本检测。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于决策分数的图像对抗样本检测方法和系统

[0001]本专利技术属于图像处理领域，尤其涉及一种基于决策分数的图像对抗样本检测方法和系统。

技术介绍

[0002]人工智能技术飞速发展，深度神经网络模型在图像处理领域取得的成绩，激励着更多的人力物力投入到计算机视觉的研究领域中。其中，卷积神经网络在图像数据处理方面，尤其是各种模式识别任务上表现尤其突出。目前它已被部署于图像分类、缺陷检测、语义分割、图像修复等任务中，在自动驾驶、人脸识别、医学影像分析等场景中得到广泛应用。
[0003]然而最近研究发现，深度模型由于其数据驱动的特性，无法可控决定系统的训练，且自身在高维特征空间中的非线性导致了容易受到对抗攻击的影响，因此阻碍了深度模型在安全等级要求较高的场景中的进一步应用和发展。人工智能逐步在众多领域替代人类进行自主决策，若数据与算法存在安全漏洞问题，则将带来重大的人身伤害和财产损失。因此研究针对对抗样本的防御和检测技术，以提高模型面对未知威胁的鲁棒性和安全性，对提高应用过程的可靠性、实现安全可信的人工智能算法具有重要的意义。
[0004]机器学习模型训练过程中，攻击者可以通过精心修改现有的训练数据影响模型的准确性，或者不断生成新的对抗样本使模型预测错误。以假乱真的对抗样本可能导致人工智能所驱动的识别系统出现漏判或者误判，精心修改的恶意软件、添加扰动的图片等对抗样本可能使分类器识别错误，将难以识别的物体放在路边可能使经过的汽车进入安全保护模式，破坏自动驾驶系统的可用性。根据是否已知攻击目标的模型结构，分为...

【技术保护点】

【技术特征摘要】
1.一种基于决策分数的图像对抗样本检测方法，其特征在于，所述方法包括：步骤S1、图像数据集的获取和预处理：获取CIFAR
‑
10、GTSRB和tiny
‑
ImageNet数据集，并对所述CIFAR
‑
10、GTSRB和tiny
‑
ImageNet数据集进行预处理；步骤S2、训练神经网络：使用不同的模型结构对不同的数据集进行训练，即对所述CIFAR
‑
10数据集使用VGG19模型进行训练，对所述GTSRB数据集使用LeNet
‑
5模型进行训练，对所述tiny
‑
ImageNet数据集使用MobileNetV1模型进行训练；步骤S3、计算决策分数：对于所述VGG19模型、LeNet
‑
5模型和MobileNetV1模型，选取各模型中的特定层以计算神经元的决策分数；步骤S4、训练二元分类器：针对所述CIFAR
‑
10、GTSRB和tiny
‑
ImageNet数据集，分别搭建不同的二元分类器，再应用各模型中的特定层计算出的决策分数，训练所述CIFAR
‑
10、GTSRB和tiny
‑
ImageNet数据集对应的二元分类器；步骤S5、二元分类器的参数优化：将对抗样本的决策分数输入到训练好的二元分类器中进行测试，若分类精度不足，则对二元分类器进行优化；将良性样本的决策分数输入到二元分类器中，若分类精度不足，则对二元分类器进行优化。2.根据权利要求1所述的一种基于决策分数的图像对抗样本检测方法，其特征在于，在所述步骤S1中，对所述CIFAR
‑
10、GTSRB和tiny
‑
ImageNet数据集进行预处理的方法包括：对于所述GTSRB数据集，从每类中随机抽取30％的图片作为测试集，其余图片作为训练集；对于所述tiny
‑
ImageNet数据集，11000张图片用于训练，2000张图片用于测试精度；对类标进行one
‑
hot编码。3.根据权利要求1所述的一种基于决策分数的图像对抗样本检测方法，其特征在于，在所述步骤S3中，所述选取各模型中的特定层以计算神经元的决策分数的方法包括：选择卷积和全连接层中间的flatten层或全局平均池化层作为决策分数计算的所选层。4.根据权利要求3所述的一种基于决策分数的图像对抗样本检测方法，其特征在于，在所述步骤S3中，所述选择卷积和全连接层中间的flatten层或全局平均池化层作为决策分数的计算层的具体方法包括：对于所述VGG19模型和LeNet
‑
5模型选取flatten层；对于所述MobileNetV1模型选取全局平均池化层。5.根据权利要求3所述的一种基于决策分数的图像对抗样本检测方法，其特征在于，在所述步骤S3中，计算决策分数的方法包括：其中，μ(x)为决策分数；x为图像样本；y
c
表示对于输入x，模型预测类标c的置信度；表示决策分数计算的所选层的输出；
表示求偏导。6.根据权利要求1所述的一种基于决策分数的图像对抗样本检测方法，其特征在于，在所述步骤S4中，针对所述CIFAR
‑
10、GTSRB和tiny
‑
ImageNet数据集，分别搭建...

【专利技术属性】
技术研发人员：景慧昀，魏薇，辛鑫，周凡棣，牛金行，赵凯闻，
申请(专利权)人：中国信息通信研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人