一种基于多元特征交互的模型后门检测方法、装置及存储介质制造方法及图纸

技术编号：36526720 阅读：19 留言：0更新日期：2023-02-01 16:06

本发明专利技术涉及机器学习安全领域，提供了一种基于多元特征交互的模型后门检测方法、装置及存储介质。主旨在于提高模型后门的识别率以及降低检测实现的计算开销。主要方案包括对于一个k分类模型F，对于每个类别i∈{1，2，...，k}，防御者准备大小为s的数据集将数据集的单个数据输入给模型F，得到模型F的logits层的输出向量然后对向量按类别做向量和得到用于判断后门的k维向量r，其中r

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多元特征交互的模型后门检测方法、装置及存储介质

[0001]本专利技术涉及机器学习安全领域，提供了一种基于多元特征交互的模型后门检测方法、装置及存储介质。

技术介绍

[0002]随着人工智能技术的发展，机器学习被运用在人们工作和生活的各个领域中。由于人工智能需要大量数据和算力的驱动，故很多个人和组织会将机器学习模型的训练任务外包给外部供应商，这就给了攻击者影响模型的机会，模型后门攻击就是一种常见的在模型训练阶段施加影响的攻击技术。
[0003]模型后门攻击通过各种手段向模型植入后门，被植入后门的模型在被部署后表现与正常模型一致，但当攻击者通过特定输入激活该模型中的后门时，该模型将按照攻击者的意图行动。早期的后门植入方法主要是通过修改模型的训练数据实现的，随着模型后门攻击技术的发展，后门的隐蔽性不断提高，后门植入的手段也变得多样，一些在模型交付或部署后向模型植入后门的技术被提出。
[0004]针对后门攻击的防御手段可被分为两类：一类为基于经验的后门防御，防御者在对攻击原理有一定了解的基础上部署防御措施，在实践中能较好的防御已有的后门攻击方法，但其有效性缺乏理论保证，且无法保证对后续出现的攻击手段的防御；另一类为基于认证的后门防御，此类方法在假定一些前提条件后在理论上证明防御的有效性，但在实践中由于假设通常无法完全满足，导致其有效性低于基于经验的后门防御方法。

技术实现思路

[0005]本专利技术的目的在于提高模型后门的识别率以及降低检测实现的计算开销。
[0006]为了实...

【技术保护点】

【技术特征摘要】
1.一种基于多元特征交互的模型后门检测方法，其特征在于，包括以下步骤：步骤1、对于一个k分类模型F，对于每个类别i∈{1，2，...，k}，防御者准备大小为s的数据集步骤2、将步骤1中准备的数据集中的数据中的数据依次输入给模型F，得到模型F对于该数据的logits层的输出向量其中代表模型F对数据为第k类的预测概率，代表提前准备的数据集中第i类数据集的第j个数据；然后对向量按类别做向量和得到用于判断后门的k维向量，其中r
m
为向量r的第m个分量，r
m
代表所有步骤1准备的数据在F模型的logits层上第m类预测结果的logits累计值，其r
m
的计算公式如下：步骤3、给定阈值b，当第m类的logits累计值r
m
高于b时，则此类受到了模型后门攻击。2.一种基于多元特征交互的模型后门检测装置，其特征在于，包括：数据集模...

【专利技术属性】
技术研发人员：刘小垒，易鸣，殷明勇，邓凯，胥迤潇，许思博，
申请(专利权)人：中国工程物理研究院计算机应用研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人