一种深度神经网络对抗样本评分方法技术

技术编号：34374750 阅读：12 留言：0更新日期：2022-07-31 12:55

本发明专利技术公开了一种深度神经网络对抗样本评分方法，提出了一种以黑盒方式评估对抗样本攻击效果的新方法，采取模糊综合评价方法，以一个名为对抗样本评分(Adversarial Examples Score,AES)的指数来评估和量化对抗样本攻击效果。具体包括计算对抗样本的可迁移性、不可察觉性、攻击成功率和标签偏移度，确定隶属度子集表，利用层次分析法确定各方面评价权重A，模糊综合评价矩阵，得到对抗样本评分指数。AES指数的输出是衡量对抗样本攻击效果的分数，可以用其来评估对抗样本对深度神经网络的危害性。性。性。

A scoring method of deep neural network against samples

全部详细技术资料下载

【技术实现步骤摘要】
一种深度神经网络对抗样本评分方法

[0001]本专利技术涉及深度神经网络领域，具体涉及一种深度神经网络对抗样本评分方法。

技术介绍

[0002]全球范围内越来越多的政府和企业组织逐渐认识到人工智能在经济和战略上的重要性。深度神经网络是人工智能的核心研究领域之一。深度学习的应用已遍及人工智能的各个分支，如专家系统、认知模拟、规划和问题求解、数据挖掘、网络信息服务、图像识别、故障诊断、自然语言理解、机器人和博弈等方面。深度神经网络技术已经渗透到人们日常生活的各个领域，同时也逐渐融入国家基础设施建设，因此，深度神经网络模型的安全关乎民生安全和国家安全。
[0003]深度神经网络技术在解决复杂任务方面取得了重大突破，然而，深度神经网络技术(尤其是人工神经网络和数据驱动人工智能)在训练或测试时极易受到对抗样本攻击，这些样本很容易颠覆机器学习技术的原定输出。例如，对于图像分类深度神经网络模型，可以通过在给定图像中添加一些扰动来生成对抗样本，这些对抗性图像从人眼中看不出与原图像的差异，但会被已知性能良好的深度神经网络模型错误分类，随着对抗性机器学习技术日趋先进复杂，且更新速度极快，深度神经网络模型面对对抗性攻击表现出极强的脆弱性。因此，有必要针对对抗样本的对抗效果、深度神经网络模型的模型性能、防御能力等方面进行评估，发现对抗样本对深度神经网络模型可能造成的安全隐患。根据对对抗样本的评估结果推荐提高模型安全性的防御策略，从而对提升深度神经网络模型的安全性。
[0004]现有的工作需要根据给定的神经网络是否能够正确分类...

【技术保护点】

【技术特征摘要】
1.一种深度神经网络对抗样本评分方法，其特征在于，包括以下步骤：步骤一，计算对抗样本的可迁移性、不可察觉性、攻击成功率和标签偏移度，所述对抗样本为图像对抗样本和/或文字对抗样本；步骤二，确定隶属度子集表；步骤三，利用层次分析法确定各方面评价权重A；步骤四，模糊综合评价矩阵，得到对抗样本评分指数。2.根据权利要求1所述一种深度神经网络对抗样本评分方法，其特征在于：所述计算对抗样本的可迁移性的步骤包括：步骤1：M
N
是一组用于评价的神经网络模型，基于待评价的对抗样本生成算法a对目标神经网络模型M1生成对抗样本a
c
；步骤2：重新训练目标神经网络模型M1，使用对抗样本a
c
对其进行测试，得到识别准确率AR1；步骤3：训练神经网络模型M
i
(i＝2，3，...N)，使用对抗样本a
c
对其进行测试，得到AR
i
，直到i＞N，N表示测试神经网络模型的数量；步骤4：计算对抗样本的可迁移性Tf，计算公式为3.根据权利要求1所述一种深度神经网络对抗样本评分方法，其特征在于：所述计算不可察觉性包括计算图像对抗样本的不可察觉性和计算文字对抗样本的不可察觉性；所述计算图像对抗样本的不可察觉性为：p范数L
p
计算干净图像x与产生的图像对抗样本x
′
之间的输入空间的距离||x
‑
x
′
||
p
，其中p∈{0，1，2，∞}，具体距离计算公式如下所示：所述计算文字对抗样本的不可察觉性为：采取语言模型困惑度的得分判断语句扰动大小和语义真实性，困惑度越小，文本对抗样本的不可察觉性越高，文本对抗样本的困惑度PP(w)的计算公式如下：其中，w
i
表示词语序列w1，w2，...，w
i
‑1中的第i个词，N表示词的总数量，p(w
i
|w1，w2，...，w
i
‑1)表示在给定一句话的前i
‑
1个词，语言模型可以预测第i个词可能出现的概率分布，句子概率越大，语言模型越好，迷惑度越小。4.根据权利要求1所述一种深度神经网络对抗样本评分方法，其特征在于：所述计算攻击成功率包括：对于定向攻击，攻击成功率的计算公式为：其中，a表示对抗样本生成算法，f表示目标模型的分类算法，是定向攻击的目标类
型，N表示样本数量，x
i
是第i个原始样本，a(x
i
)表示样本x
i
在算法...

【专利技术属性】
技术研发人员：陈龙，艾锐，欧阳柳，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人