一种针对图像分类模型的后门触发器检测方法技术

技术编号：40945843 阅读：22 留言：0更新日期：2024-04-18 15:03

本发明专利技术提出了一种针对图像分类模型的后门触发器检测方法，实现步骤为：获取训练样本集；获取每个类别的高熵数据集和低熵数据集；获取候选后门触发器的位置；确定候选后门触发器；获取每类高熵图像的标签转换检测图像；获取后门触发器的检测结果。本发明专利技术通过对每个目标类别的多幅低熵图像的均值图像像素点的设置，获取每个类别的候选后门触发器位置矩阵，并通过该位置矩阵与该类别对应的任意一幅低熵图像确定候选后门触发器，避免了现有技术需要生成多个对照模型导致的计算量大耗时长的缺陷，且在对每个类别的潜在后门触发器进行恢复的过程中不需要优化目标函数，有效提高了检测效率和所恢复触发器的精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于人工智能，涉及一种针对图像分类模型的后门触发器检测方法，可应用于信息安全行业、人脸识别等领域。

技术介绍

1、随着人工智能科学的发展，机器学习技术已经渗透在生活的各个方面。深度学习在图像识别领域，如门禁系统、自动驾驶和医疗诊断，得到了广泛的应用。

2、现阶段最常见的后门攻击是攻击者通过添加触发器和标签来修改一部分训练样本，再输入到神经网络模型中进行训练，后门触发器是攻击者激发已埋藏在模型中的后门的必要媒介，在后门未被激发时，被攻击的模型具有和正常模型类似的表现；而当模型中埋藏的后门被攻击者指定的后门触发器激活时，模型的输出就变为攻击者预期的标签以达到恶意的目的。如果向人脸识别的门禁系统中注入这样一个后门，把戴着黑色帽子的人的权限识别为可随意进出的权限，这样就会存在巨大的安全隐患。通过对后门进行检测，可以预防攻击者在模型中埋藏后门或可以及时发现触发器的图像。

3、为了减轻后门威胁，现阶段提出了不同的防御方法。总的来说，这些方法可以分为两大类，包括经验后门防御和认证后门防御。经验后门防御是在对现有攻击的...

【技术保护点】

1.一种针对图像分类模型的后门触发器检测方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的方法，其特征在于，步骤(2)中所述的深度卷积神经网络模型，包括层叠的输入层、多个卷积层和一个全连接层，每两个卷积层之间各加载有一个最大池化层。

3.根据权利要求2所述的方法，其特征在于，步骤(2)中所述的对深度卷积神经网络模型进行迭代训练，实现步骤为：

4.根据权利要求1所述的方法，其特征在于，步骤(2)中所述的计算每个训练样本Xn的熵En，计算公式为：

5.根据权利要求1所述的方法，其特征在于，步骤(3)中所述的K幅低熵图像的均值图像BAy，...

【技术特征摘要】

1.一种针对图像分类模型的后门触发器检测方法，其特征在于，包括如下步骤：

3.根据权利要求2所述的方法，其特征在于，步骤(2)中所述的对深度卷积神经网络模型进行迭代训练，实现步骤为：

4.根据权利要求1所述的方法，其特征在于，步骤(2)中所述的计算每个训练样本xn的熵en，计算公式为：

5.根据权利要求1所述的方法，其特征在于，步骤(3)中所述的k幅低熵图像的均值图像bay，计算公式为：

6.根据权利要求1所述的方法，其特征在于，步骤...

【专利技术属性】
技术研发人员：马卓，李怡华，杨易龙，刘洋，李腾，张俊伟，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人