基于注意力机制，知识蒸馏防御后门攻击的方法及系统技术方案

技术编号：30366620 阅读：26 留言：0更新日期：2021-10-16 17:36

本发明专利技术公开了基于注意力机制，知识蒸馏防御后门攻击的方法及系统，应用于互联网安全技术领域，包括：神经网络微调步骤：将目标神经网络进行微调，得到一个微调后的深度神经网络；注意力图生成步骤：将深度神经网络每一个激活层的输出通过注意力映射算子，映射到注意力图上；模型自蒸馏步骤：利用注意力图逐层进行深度神经网络的知识自蒸馏处理，得到得到各层之间的蒸馏损失；防御模块生成步骤：通过模型交叉损失函数，训练得到防御模型。本发明专利技术可以有效防御后门攻击，并且防御效果远远超过了传统方法；在消除网络对触发模式的注意力方面也更有效。有效。有效。

全部详细技术资料下载

【技术实现步骤摘要】
基于注意力机制，知识蒸馏防御后门攻击的方法及系统

[0001]本专利技术涉及互联网安全
，尤其涉及基于注意力机制，知识蒸馏防御后门攻击的方法及系统。

技术介绍

[0002]随着人工智能的发展，机器学习模型已广泛应用到各行各业，在各个场景发挥着非常重要的作用。后门攻击是一种新兴的针对机器学习模型的攻击方式，攻击者会在模型中埋藏后门，使得被感染的模型在一般情况下表现正常。但当后门被激活时，模型的输出将变为攻击者预先设置的恶意目标。具体为：攻击者通过带有后门触发器(Backdoor Trigger)的恶意数据训练模型后，获得一个带有后门的恶意模型。这类恶意模型在输入良性数据时可以将其正确分类，但当输入恶意数据时，其后门触发器会激活恶意神经元，从而导致错误分类(并且往往是某一特定类别)。
[0003]现有技术中，没有有效的防御后门攻击的方法，这类攻击具有极强的隐蔽性，给攻击检测带来了巨大挑战，也给一些资源受限型用户将深度神经网络的训练过程外包给拥有丰富存储和计算资源的第三方带来了不小的风险。
[0004]因此，提出一种新的防御后门攻击的方法，克服现有技术中后门攻击防御困难，是本领域技术人员亟需解决的问题。

技术实现思路

[0005]有鉴于此，本专利技术提供了基于注意力机制，知识蒸馏防御后门攻击的方法及系统，充分考虑了攻击者的各种攻击手段，可以进行全面防御。
[0006]为了实现上述目的，本专利技术采用如下技术方案：
[0007]基于注意力机制，知识蒸馏防御后门攻击的方法，...

【技术保护点】

【技术特征摘要】
1.基于注意力机制，知识蒸馏防御后门攻击的方法，其特征在于，包括以下步骤：神经网络微调步骤：将目标神经网络进行微调，得到一个微调后的深度神经网络；注意力图生成步骤：将深度神经网络每一个激活层的输出通过注意力映射算子，映射到注意力图上；模型自蒸馏步骤：利用注意力图逐层进行深度神经网络的知识自蒸馏处理，得到得到各层之间的蒸馏损失；防御模块生成步骤：模型自蒸馏后的模型通过模型交叉损失函数，训练得到防御模型。2.根据权利要求1所述的基于注意力机制，知识蒸馏防御后门攻击的方法，其特征在于，神经网络微调步骤的具体内容包括：选择一个训练好的深度神经网络；将该深度神经网络的前n层复制到目标神经网络中；将剩余层进行随机初始化，利用干净的数据集进行训练，得到训练误差；将训练误差反向传播到目标神经网络复制的前n层中，得到微调后的深度神经网络。3.根据权利要求1所述的基于注意力机制，知识蒸馏防御后门攻击的方法，其特征在于，注意力图生成步骤的具体内容包括：获得深度神经网络各激活层输出，通过注意力映射算子，将每一个输出映射到注意力图上，得到各区块的注意力图。4.根据权利要求1所述的基于注意力机制，知识蒸馏防御后门攻击的方法，其特征在于，模型自蒸馏步骤的具体内容包括：分别对任一区块注意力图和目标区块注意力图采用双线性插值，进行维度调整；分别对维度调整后...

【专利技术属性】
技术研发人员：陈艳姣，龚雪鸾，董建硕，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人