基于深度学习的对抗样本攻击检测方法、装置及电子设备制造方法及图纸

技术编号：34081441 阅读：22 留言：0更新日期：2022-07-11 18:58

本申请提供一种基于深度学习的对抗样本攻击检测方法、装置及电子设备，该方法包括：利用优化的基于动量迭代梯度方式，生成干净样本对应的对抗样本；依据所述干净样本对应的对抗样本确定深度神经网络模型的防攻击性能评估结果。该方法可以更有效地对深度神经网络模型的防攻击性能进行评估。的防攻击性能进行评估。的防攻击性能进行评估。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的对抗样本攻击检测方法、装置及电子设备

[0001]本申请涉及人工智能安全
，尤其涉及一种基于深度学习的对抗样本攻击检测方法、装置及电子设备。

技术介绍

[0002]目前，深度学习的发展为人工智能的应用提供了一种可靠的工具，深度神经网络（Deep Neural Networks，DNNs）已在计算机视觉（如人脸识别、目标检测、自动驾驶）等领域被广泛应用。在自然图像上（如CIFAR
‑
10和ImageNet数据集），最先进的卷积神经网络在图像分类任务中的识别率已经超过人眼。由于DNNs的优秀表现和传统工具的高成本，用深度学习算法取而代之是合适的选择，因此DNN也已成为图像处理任务的流行工具。
[0003]尽管DNNs性能优越，但研究发现，DNNs很容易受到精心设计的对抗样本的影响，这些对抗样本可以通过在原图添加很小的肉眼无法识别的扰动生成，即轻微扰动的输入样本可以使DNNs做出错误的预测。对抗样本的存在使DNNs在图像领域的应用令人感到担忧。
[0004]如何准确地检测深度神经网络模型对干扰样本的防攻击性能成为亟待解决的技术问题。

技术实现思路

[0005]有鉴于此，本申请提供一种基于深度学习的对抗样本攻击检测方法、装置及电子设备。
[0006]具体地，本申请是通过如下技术方案实现的：根据本申请实施例的第一方面，提供一种基于深度学习的对抗样本攻击检测方法，包括：利用优化的基于动量迭代梯度方式，生成干净样本对应的对抗样本；依据所述干净样本对应的对...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的对抗样本攻击检测方法，其特征在于，包括：利用优化的基于动量迭代梯度方式，生成干净样本对应的对抗样本；依据所述干净样本对应的对抗样本确定深度神经网络模型的防攻击性能评估结果；其中，对于任一干净样本，在生成该干净样本对应的对抗样本的任一次迭代过程中：依据当前的动量以及交叉熵损失，确定第一梯度，并依据当前的对抗样本以及所述第一梯度，确定第一阶段对抗样本；依据所述第一阶段对抗样本与该干净样本的特征表示输出差异，确定特征空间损失，依据所述特征空间损失，确定第二梯度，并依据所述第一阶段对抗样本以及所述第二梯度，确定第二阶段对抗样本；所述特征空间损失用于表征所述第一阶段对抗样本与该干净样本之间的特征空间距离，且与所述第一阶段对抗样本与该干净样本之间的特征空间距离正相关；在迭代次数达到预设最大迭代次数的情况下，将所述第二阶段对抗样本确定为该干净样本对应的对抗样本。2.根据权利要求1所述的方法，其特征在于，所述依据所述第一阶段对抗样本与该干净样本的特征表示输出差异，确定特征空间损失，包括：依据所述第一阶段对抗样本与该干净样本的特征表示输出差异，利用投影公式，确定特征空间损失。3.根据权利要求1所述的方法，其特征在于，所述依据所述第一阶段对抗样本与该干净样本的特征表示输出差异，确定特征空间损失，包括：依据所述第一阶段对抗样本与该干净样本的特征表示输出差异的范数，确定特征空间损失。4.根据权利要求1所述的方法，其特征在于，所述依据所述第一阶段对抗样本与该干净样本的特征表示输出差异，确定特征空间损失，包括：依据所述第一阶段对抗样本与该干净样本的特征表示输出差异，利用投影公式，确定第一特征空间损失；以及，依据所述第一阶段对抗样本与该干净样本的特征表示输出差异的范数，确定第二特征空间损失；依据所述第一特征空间损失、第二特征空间损失，以及，预设特征空间损失均衡参数，确定最终特征空间损失。5.根据权利要求1所述的方法，其特征在于，所述依据当前的对抗样本以及所述第一梯度，确定第一阶段对抗样本，包括：依据当前的对抗样本、所述第一梯度、预设步长，以及，预设步长调节参数，确定所述第一阶段对抗样本；所述依据所述第一阶段对抗样本以及所述第二梯度，确定第二阶段对抗样本，包括：依据所述第一阶段对抗样本、所述第二梯度、所述预设步长，以及，所述预设步长调节参数，确定所述第二阶段对抗样本。6.根据权利要求5所述的方法，其特征在于，所述依据当前的对抗样本、所述第一梯度、预设步长，以及，预设步长调节参数，确定所述第一阶段对抗样本，包括：依据所述预设步长以及所述预设步长调节参数，确定第一步长；
依据当前的对抗样本、所述第一梯度，以及，所述第一步长，确定所述第一阶段对抗样本；所述依据所述第一阶段对抗样本、所述第二梯度、所述预设步长，以及，所述预设步长调节参数，确定所述第二阶段对抗样本，包括：依据所述预设步长以及所述预设步长调节参数，确定第二步长；依据所述第一阶段对抗样本、所述第二梯度，以及，所述第二步长，确定所述第二阶段对抗样本。7.一种基于深度学习的对抗样本攻击检测装置，其特征在于，包括：生成单元，用于利用优化的基于动量迭代梯度方式，生成干净样本对应的对抗样本；检测单元，用于依据所述干净样...

【专利技术属性】
技术研发人员：王滨，钱亚冠，陈思，王星，李超豪，谢瀛辉，王伟，赵海涛，
申请(专利权)人：杭州海康威视数字技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人