一种对抗样本防御方法、系统、介质、设备及终端技术方案

技术编号：38614782 阅读：9 留言：0更新日期：2023-08-26 23:42

本发明专利技术属于人工智能安全技术领域，公开了一种对抗样本防御方法、系统、介质、设备及终端，输入待分类的图像数据，使用分类网络结合攻击算法得到包含原始数据和对抗样本数据的数据集；使用数据集训练生成对抗网络，利用生成器对对抗样本进行“映射”，生成一个新的重构样本来达到去噪的效果；将重构样本输入最终的分类模型中完成分类。对发明专利技术中使用的分类器和鉴别器均采用全卷积的形式进行改进；发明专利技术中使用的生成器使用3个stride＝2的卷积层获得特征图，再使用3个stride＝2的逆卷积层恢复原始分辨率。本发明专利技术能够有效地解决图像样本遭受对抗攻击的问题，在保证防御精度的同时大大降低训练成本，使算法更具鲁棒性，更有利于后续的分类任务。分类任务。分类任务。

全部详细技术资料下载

【技术实现步骤摘要】
一种对抗样本防御方法、系统、介质、设备及终端

[0001]本专利技术属于人工智能安全
，尤其涉及一种对抗样本防御方法、系统、介质、设备及终端。

技术介绍

[0002]目前，人工智能的理论和技术正在不断成熟。深度学习作为人工智能领域的高级算法，在人工智能逐渐成为社会发展必然趋势的同时，不可避免地被应用于许多与安全相关的关键任务中，尤其以图像领域中的应用最为普及与深入。
[0003]自“对抗样本”出现以来，人工智能便开始面临许多潜在的威胁。攻击者可以在样本中添加人类难以察觉的扰动来进行攻击。比如目前热度最高的“智能驾驶”，它就是通过训练模型在道路上做出决策的，在智能驾驶过程中，车辆通过智能动态调速与前车保持车距，传感器自动识别交通指示牌来决策车辆动作。若攻击者在交通指示牌上添加极其细微的扰动使其变成对抗样本，那么智能驾驶汽车势必会将其识别错误从而给出错误的决策，这将会引起非常严重的交通事故，从而造成人员伤亡。现阶段人工智能也被应用在银行、保险等金融系统中来为客户的信用进行打分，对抗样本同样能使神经网络错误预测客户信用，从而给个人和机构造成巨大的财产损失。能源、电力、金融、国防等关系到国家核心利益的基础设施也容易受到对抗样本攻击，从而给国家和社会带来非常恶劣的影响。这些都将破坏整个人工智能生态应用的进程与基本信任。所以对抗样本防御方法的研究是目前的研究重点。
[0004]迄今为止，研究者们针对对抗样本提出了如对抗训练、数据压缩、样本重构等多种防御方法。但这些方法都不同程度地存在一定的局限性，如数据资源...

【技术保护点】

【技术特征摘要】
1.一种对抗样本防御方法，其特征在于，对抗样本防御方法包括：输入待分类的图像数据，使用分类网络结合FGSM攻击算法得到包含原始数据和对抗样本数据的数据集；使用数据集训练生成对抗网络的生成器和鉴别器；将对抗样本输入训练好的生成器中生成与原始图像样本分布一致的重构样本；将重构样本输入最终的分类模型中完成分类。2.如权利要求1所述的对抗样本防御方法，其特征在于，对抗样本防御方法包括以下步骤：步骤一，向分类器模型中输入原始图像样本数据集；步骤二，在分类器模型中结合攻击算法生成对抗样本，构造包含原始样本和对抗样本的数据集；步骤三，使用步骤二得到的数据集，结合生成器和鉴别器的零和博弈损失函数训练生成对抗网络；步骤四，将待分类的对抗样本数据输入训练好的生成器中，生成与原始样本分布一致的重构样本；步骤五，将重构样本输入最终的分类器模型中进行分类；其中，分类器和鉴别器采用全卷积的形式；生成器使用3个stride＝2的卷积层获得特征图，再使用3个stride＝2的逆卷积层恢复原始分辨率。3.如权利要求2所述的对抗样本防御方法，其特征在于，步骤二中，根据下式生成对抗样本：式中，x表示原始样本，ε表示权重参数，L(x,y)表示损失函数；步骤三中，根据下式分别计算生成器和鉴别器的损失值：l
g
＝ε1l
mse
+ε2l
adv
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)式中，l
mse
表示去噪误差，l
adv
表示对抗性损失，分别定义如下：表示对抗性损失，分别定义如下：式中，A、B分别表示图像的横坐标和纵坐标，X和X
adv
分别表示原始样本和对抗样本。4.如权利要求2所述的对抗样本防御方法，其特征在于，步骤一和步骤五中，用于训练和最终的分类器模型使用全卷积层的形式对网络结构进行改进，具体包括：(1)获取输入的原始图像样本数据；(2)输入数据经过卷积核为5的卷积层对图像中每个通道的矩阵从左到右、从上到下进行互相关运算，提取输入图像数据的信息；(3)对步骤(2)的结果经过Relu激活函数，激活神经元，利用非线性变换的特征，使神经元对输入信号做出反应；(4)设置池化窗口为2*2，步长为2，池化窗口对步骤(3)的结果，从最左上方开始，按从左往右、从上往下的顺序依次在数组中滑动，窗口中的输入子数组的平均值为输出数组中
相应位置的元素；(5)以步骤(4)的结果作为输入数据，继续循环执行步骤(2)、(3)(4)1次；(6)将步骤(5)的结果经过卷积核为4的卷积层对图像中每个通道的矩阵从左到右、从上到下进行互相关运算，提取输入图像数据的信息；(7)将步骤五的结果使用log_softmax函数得到概率最大的结果，确定分类器对输入样本分类的最终结果。5.如权利要求2所述的对抗样本防御方法，其特征在于，步骤三中的鉴别器同样使用全卷积层构成神经网络，具体包括：(1)获取输入的待判别的图像数据；(2)输入数据经过卷积核为3、步长为2的卷积层对图像中每个通道的矩阵从左到右、从上到下进行互相关运算，提取输入图像数据的信息；(3)对步骤(2)的结果进行标准...

【专利技术属性】
技术研发人员：卢嘉中，王晨莉，舒健，吴畏，许小锋，卢虹宇，
申请(专利权)人：成都信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人