一种对抗蒸馏神经网络模型的方法及计算设备技术

技术编号：17838196 阅读：51 留言：0更新日期：2018-05-03 19:40

本发明专利技术公开了一种对抗蒸馏神经网络模型的方法，其中神经网络模型包括具有特征层结构的前向网络和输出多分类下概率向量的softmax层，该方法适于在计算设备中执行，包括步骤：根据蒸馏温度在原始的神经网络模型的前向网络和softmax层之间加入缩放层，生成第一神经网络模型；利用训练样本自身的第一标签训练第一神经网络模型，得到第二神经网络模型；将训练样本输入第二神经网络模型，经softmax层输出表征训练样本在多分类下概率向量的第二标签；利用第二标签和第一标签同时约束训练第二神经网络模型，得到第三神经网络模型；删除第三神经网络模型中的缩放层，以得到对抗蒸馏后的神经网络模型。本发明专利技术一并公开了相应地计算设备。

A method and equipment for counteracting distillation neural network model

The invention discloses a method against the model of a distilled neural network, in which the neural network model includes a forward network with a feature layer structure and a softmax layer of a probability vector under the output multi classification. The method is suitable for execution in a computing device, including the steps of the forward network of the original neural network model according to the temperature of the distillation. The first neural network model is generated by adding the scaling layer between the collaterals and the softmax layer, and the second neural network model is obtained by training the first neural network model of the training sample itself. The training samples are input into the second neural network model and the training samples are represented by the softmax layer in the multiple classification of the probability vector second. Label; the third neural network model is obtained by using the second tag and the first label to train the second neural network model simultaneously, and the scaling layer in the third neural network model is deleted to get the neural network model after the anti distillation. The present invention discloses the corresponding computing equipment in the same way.

全部详细技术资料下载

【技术实现步骤摘要】
一种对抗蒸馏神经网络模型的方法及计算设备
本专利技术涉及图像处理
，尤其是一种对抗蒸馏神经网络模型的方法及计算设备。
技术介绍
深度神经网络在现如今的分类回归问题上总是能取得非常准确的结果，在海量数据支撑下，训练出来的深度神经网络模型也具有很强的泛化能力，故，近年来深度神经网络在计算机视觉、语音识别等方面得到广泛地应用。然而这些深度神经网络模型在实际应用中也会存在一些缺陷和漏洞。例如，在不清楚网络模型结构和参数的情况下，对网络的输入做特殊的微小扰动，这些从人的主观上并不会对判断造成任何影响，然而却能使网络模型输出置信度很高的错误结果，这些被“微小扰动”过的输入被称为“对抗样本”。上述问题直接影响到了神经网络模型的泛化能力和安全性。常见的用于提高神经网络模型的泛化能力和安全性的方案是：在神经网络模型的训练数据中加入对抗样本，以此降低网络模型对这些对抗样本识别的错误率，同时进一步提高模型的泛化能力。然而，对抗样本构建的多样性等导致了这种处理方式没有达到预期的效果。因此，需要一种能够提供神经网络模型泛化能力和安全性的方案。
技术实现思路
为此，本专利技术提供了一种对抗蒸馏神经网络模型的方法及计算设备，以力图解决或者至少缓解上面存在的至少一个问题。根据本专利技术的一个方面，提供了一种对抗蒸馏神经网络模型的方法，其中神经网络模型包括具有特征层结构的前向网络和输出多分类下概率向量的softmax层，该方法适于在计算设备中执行，包括步骤：根据蒸馏温度在原始的神经网络模型的前向网络和softmax层之间加入缩放层，生成第一神经网络模型；利用训练样本自身的第一标签训练第一...
一种对抗蒸馏神经网络模型的方法及计算设备

【技术保护点】
一种对抗蒸馏神经网络模型的方法，其中神经网络模型包括具有特征层结构的前向网络和输出多分类下概率向量的softmax层，所述方法适于在计算设备中执行，所述方法包括步骤：根据蒸馏温度在原始的神经网络模型的前向网络和softmax层之间加入缩放层，生成第一神经网络模型；利用训练样本自身的第一标签训练所述第一神经网络模型，得到第二神经网络模型；将训练样本输入所述第二神经网络模型，经softmax层输出表征训练样本在多分类下概率向量的第二标签；利用所述第二标签和第一标签同时约束训练所述第二神经网络模型，得到第三神经网络模型；以及删除第三神经网络模型中的缩放层，以得到对抗蒸馏后的神经网络模型。

【技术特征摘要】
1.一种对抗蒸馏神经网络模型的方法，其中神经网络模型包括具有特征层结构的前向网络和输出多分类下概率向量的softmax层，所述方法适于在计算设备中执行，所述方法包括步骤：根据蒸馏温度在原始的神经网络模型的前向网络和softmax层之间加入缩放层，生成第一神经网络模型；利用训练样本自身的第一标签训练所述第一神经网络模型，得到第二神经网络模型；将训练样本输入所述第二神经网络模型，经softmax层输出表征训练样本在多分类下概率向量的第二标签；利用所述第二标签和第一标签同时约束训练所述第二神经网络模型，得到第三神经网络模型；以及删除第三神经网络模型中的缩放层，以得到对抗蒸馏后的神经网络模型。2.如权利要求1所述的方法，其中，所述缩放层适于按照蒸馏温度对softmax层的输入做缩小处理。3.如权利要求1或2所述的方法，其中，利用训练样本自身的第一标签训练第一神经网络模型得到第二神经网络模型的步骤包括：利用第一标签通过第一损失函数监督所述第一神经网络模型的训练，得到第二神经网络模型。4.如权利要求1-3中任一项所述的方法，其中，利用所述第二标签和第一标签同时约束训练第二神经网络模型得到第三神经网络模型的步骤包括：利用第一标签通过第一损失函数对所述第二神经网络模型进行分类监督训练；利用第二标签通过第二损失函数对所述第二神经网络模型进行回归监督训练；以及结合第一损失函数和第二损失函数训练得到第三神经网络模型。5.如权利要求4所述的方法，其中，所述结合第一损失函数和第二...

【专利技术属性】
技术研发人员：陈良，洪炜冬，张伟，许清泉，王喆，
申请(专利权)人：厦门美图之家科技有限公司，
类型：发明
国别省市：福建,35

全部详细技术资料下载我是这个专利的主人