【技术实现步骤摘要】
图像模型隐蔽后门的检测方法及系统、存储介质、终端
[0001]本专利技术涉及一种数据处理
,特别是涉及一种图像模型隐蔽后门的检测方法及系统、存储介质、终端。
技术介绍
[0002]随着人工智能的发展,机器学习模型已广泛应用到各行各业,在各个场景发挥着非常重要的作用。后门攻击是一种新兴的针对机器学习模型的攻击方式,攻击者会在模型中埋藏后门,使得被感染的模型在一般情况下表现正常。但当后门被激活时,模型的输出将变为攻击者预先设置的恶意目标。
[0003]以图像模型为例,攻击者在训练数据集中的部分图片上添加较小区域的标识,并将图片的标签指定为特定目标。使用含有上述图片的数据集训练得到的深度神经网络,会在推理阶段将带有同样标识的图片分类为上述目标,该标识称为后门,该攻击手段称为神经网络后门攻击。最初出现的后门攻击方法是在图片上添加明显的后门标识,具有一定的可辨识度,易被肉眼识别而拒绝使用,导致攻击失败。但是,近年来发展出一些新的隐蔽后门攻击方法,使用技术手段降低后门标识的可辨识度。
[0004]因此,一种针对图像 ...
【技术保护点】
【技术特征摘要】
1.一种图像模型隐蔽后门的检测方法,其特征在于,包括:获取训练样本图像,并将每个所述训练样本图像分别转换为频谱图像;对所述频谱图像进行目标检测得到目标图像,将所述目标图像从与其对应所述频谱图像上提取并作为待定频谱图像碎片;分别统计每一相同的所述待定频谱图像碎片的个数,并根据每一相同的所述待定频谱图像碎片的个数确定嵌入所述频谱图像中的触发器图案;基于所述触发器图案,确定所述触发器图案所在的频谱图像,以完成对带有所述触发器图案的后门样本图像的检测。2.根据权利要求1所述的图像模型隐蔽后门的检测方法,其特征在于,所述根据每一相同的所述待定频谱图像碎片的个数确定嵌入所述频谱图像中的触发器图案,包括:对所述待定频谱图像碎片进行特征提取,得到碎片特征;分别统计每一相同的所述碎片特征的个数,并将个数高于第一预设阈值的所述碎片特征作为嵌入所述频谱图像中的触发器图案特征;将带有所述触发器图案特征的所述待定频谱图像碎片作为所述触发器图案。3.根据权利要求2所述的图像模型隐蔽后门的检测方法,其特征在于,所述分别统计每一相同的所述碎片特征的个数,并将个数高于第一预设阈值的所述碎片特征作为嵌入所述频谱图像中的触发器图案特征,包括:基于所有所述待定频谱图像碎片的碎片特征,分别生成与每一所述碎片特征对应的特征向量;分别统计每一相同的所述特征向量的个数,并对所述特征向量的个数与所述训练样本图像总数之比进行计算,获得计算结果;若所述计算结果大于第二预设阈值,则将与所述计算结果对应的所述特征向量作为所述触发器图案特征向量;将与所述触发器图案特征向量对应的碎片特征作为所述触发器图案特征。4.根据权利要求3所述的图像模型隐蔽后门的检测方法,其特征在于,所述碎片特征包括碎片尺寸特征、碎片最大亮度特征、碎片最小亮度特征、以及碎片平均亮度特征;所述基于所有所述待定频谱图像碎片的碎片特征,分别生成与每一所述碎片特征对应的特征向量,包括:基于所述碎片尺寸特征、碎片最大亮度特征、碎片最小亮度特征、以及碎片平均亮度特征,生成每一所述待定频谱图像碎片对应的特征向量;所述分别统计每一相同的所述特征向量的个数,并对所述特征向量的个数与所述训练样本图像总数之比进行计算,获得计算结果,包括:对每一所述待定频谱图像碎片对应的特征向量进行分类并统计,获得每一相同的所述待定频谱图像碎片对应的特征向量的个数信息。5.根据权利要求1所述的图像模型隐蔽后门的检测方法,其特征在于,所述分别统计每一相同的所述待定频谱图像碎片的个数,包括:基于所有所述待定频谱图像碎片的尺寸信息,对所述待定频谱图像碎片进行分类处...
【专利技术属性】
技术研发人员:周晓勇,梁淑云,刘胜,马影,陶景龙,王启凡,魏国富,夏玉明,徐明,殷钱安,余贤喆,
申请(专利权)人:上海观安信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。