对抗性插值后门检测制造技术

技术编号：37999459 阅读：13 留言：0更新日期：2023-06-30 10:13

一个或多个计算机处理器确定与不可信模型和对抗性训练方法相关联的容限值和范数值。一个或多个计算机处理器利用对抗性训练方法生成在图像对之间测距的多个插值的对抗性图像，其中，该对图像中的每个图像来自不同的类别。一个或多个计算机处理器利用所生成的多个插值的对抗性图像来检测与不可信模型相关联的后门。一个或多个计算机处理器通过利用所生成的多个经插值的对抗性图像训练不可信模型来硬化不可信模型。来硬化不可信模型。来硬化不可信模型。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】对抗性插值后门检测

技术介绍

[0001]本专利技术一般涉及机器学习领域，尤其涉及检测经后门攻击的神经网络。
[0002]深度学习是基于一组算法的机器学习的分支，该组算法通过使用具有复杂结构或另外的通常由多个非线性变换组成的模型架构来对数据中的高级抽象建模。深度学习是基于数据的学习表示的更广泛的机器学习方法家族的一部分。观察结果(例如，图像)可以以许多方式表示，例如每个像素的强度值的向量，或者以更抽象的方式表示为一组边缘、特定形状的区域等。一些表示使得更容易从示例学习任务(例如，面部识别或面部表情识别)。深度学习算法通常使用多个非线性处理单元层的级联来进行特征提取和变换。每个连续层使用来自前一层的输出作为输入。算法可以是有监督的或无监督的，并且应用包括模式分析(无监督的)和分类(有监督的)。
[0003]神经网络(NN)是由生物神经网络启发的计算系统。NN不是简单的算法，而是针对用于一起工作并处理复杂的数据输入的许多不同机器学习算法的框架。这样的系统通过考虑示例来学习执行任务，通常不用任何任务特定的规则来编程。例如，在图像识别中，NN通过分析被正确标记为真或假(例如，猫或非猫)的示例图像并使用结果识别其他图像中的对象(例如，猫)，来学习识别包含猫的图像。在该示例中，NN在没有关于猫的任何先验知识的情况下分类，例如，猫具有毛、尾巴、胡须和尖的耳朵。相反，NN自动根据学习材料生成识别特征。NN基于称为人工神经元的连接单元或节点的集合，这些连接单元或节点对生物脑中的神经元进行松散的建模，其中每个连接像生物脑中的突触一般可以将信号从一...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法，包括：由一个或多个计算机处理器确定与不可信模型和对抗性训练方法相关联的容限值和范数值；由一个或多个计算机处理器利用所述对抗性训练方法生成范围在图像对之间的多个经插值的对抗性图像，其中，所述图像对中的每个图像来自不同的类别；由一个或多个计算机处理器利用所生成的多个经插值的对抗性图像来检测与所述不可信模型相关联的后门；以及由一个或多个计算机处理器通过用所生成的多个经插值的对抗性图像训练所述不可信模型来硬化所述不可信模型。2.根据权利要求1所述的计算机实现的方法，其中，利用所述对抗性训练方法生成范围在所述图像对之间的所述多个经插值的对抗性图像包括：由一个或多个计算机处理器针对测试集中包含的每个类别，迭代地执行朝向指定类别的到经插值的对抗性图像的子集中的一个或多个扰动。3.根据权利要求2所述的计算机实现的方法，其中所述一个或多个扰动是经线性插值的。4.根据权利要求1所述的计算机实现的方法，还包括：由一个或多个计算机处理器利用人机回环训练方法来监控所述不可信模型。5.根据权利要求4所述的计算机实现的方法，还包括：由一个或多个计算机处理器周期性地显示与所述不可信模型相关联的一个或多个梯度。6.根据权利要求1所述的计算机实现的方法，还包括：由一个或多个计算机处理器过滤包含检测到的后门的一个或多个后续输入。7.根据权利要求1所述的计算机实现的方法，其中，经硬化的模型被部署用于推断。8.根据权利要求1所述的计算机实现的方法，还包括：由一个或多个计算机处理器接收所述不可信模型、相关联的预先训练的权重、干净测试集、验证集以及所述对抗性训练方法，其中，所述干净测试集和所述验证集各自包含具有相关联的标签的多个图像。9.一种计算机程序产品，包括：一个或多个计算机可读存储介质和存储在所述一个或多个计算机可读存储介质上的程序指令，所存储的程序指令包括：用于确定与不可信模型和对抗性训练方法相关联的容限值和范数值的程序指令；用于利用所述对抗性训练方法生成范围在图像对之间的多个经插值的对抗性图像的程序指令，其中，所述图像对中的每个图像来自不同的类别；用于利用所生成的多个经插值的对抗性图像来检测与所述不可信模型相关联的后门的程序指令；以及用于通过利用所生成的多个经插值的对抗性图像训练所述不可信模型来硬化所述不可信模型的程序指令。10.根据权利要求9所述的计算机程序...

【专利技术属性】
技术研发人员：H，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人