面向深度模型供应链的多方协作的漏洞判定方法与装置制造方法及图纸

技术编号：35491248 阅读：44 留言：0更新日期：2022-11-05 16:47

本发明专利技术公开一种面向深度模型供应链的多方协作的漏洞判定方法与装置，首先获取上游任务数据集，并对神经网络进行训练；对上游任务数据集进行中毒操作，得到中毒样本；并训练得到中毒模型，将中毒模型的输出作为中毒特征；利用中毒特征作为约束条件，训练上游预训练模型，若上游预训练模型的输出带有中毒特征，且没有被在线模型市场中的检测器检测到，则判定在线模型市场中的检测器存在漏洞；下游任务供应商下载预训练模型，并检查下游数据集，若下游任务供应商判定下游数据集不存在漏洞，则对预训练模型进行微调，将带有触发器的测试样本输入到预训练模型中，若其输出为误标记的类；则判定下游任务供应商先对下游数据集进行检查过程存在漏洞。查过程存在漏洞。查过程存在漏洞。

全部详细技术资料下载

【技术实现步骤摘要】
面向深度模型供应链的多方协作的漏洞判定方法与装置

[0001]本专利技术涉及深度学习领域，尤其涉及一种面向深度模型供应链的多方协作的漏洞判定方法与装置。

技术介绍

[0002]人工智能技术的飞速发展，深度神经网络模型在目标检测、语义分析和视频理解等领域引起了广泛关注。同时，预训练模型(PTM)在图像分类和自然语言处理领域取得了巨大的成功。该模型首先从大规模数据集中获取知识，然后可以应用于各种特定任务。预训练模型的过程需要海量训练数据，并占用了极其昂贵的计算资源，这对资源不足的普通用户来说非常困难。因此，大多数用户下载已发布的预训练模型，如面向自然语言处理任务的BERT和XLNet，以及面向图像分类任务的VGGNet，针对下游的特定任务进行进一步微调，并将其在业应用程序中广泛部署。
[0003]深度学习模型的供应链包括以下三个阶段：预训练、微调、分类任务。在预训练过程中，模型发布者利用庞大的数据集和强力的计算集群训练基础的预训练模型，该模型能够对不同的输入样本输出特征表示。预训练模型将被上传到模型市场中，经过安全性测试后，将被公开发布和销售。在微调阶段，下游任务供应商从云端下载预训练模型，并对其进行微调，以适应特定的下游任务。供应商往往会增加或改动预训练模型的分类器结构，然后以有监督的方式使用下游任务的数据集对模型进行微调训练。由于预训练模型在预训练阶段已经获得了强大的特征提取能力，因此，经过微调的模型可以继承预训练模型的知识，以提供下游任务所需的特征及分类结果。在分类阶段，下游任务服务商将经过微调的模型进行部...

【技术保护点】

【技术特征摘要】
1.一种面向深度模型供应链的多方协作的漏洞判定方法，其特征在于，所述方法具体包括以下步骤：(1)获取图像数据集作为上游任务数据集，并对其进行归一化处理；(2)使用步骤(1)中选取的上游任务数据集对神经网络进行训练；(3)对步骤(1)中选取的上游任务数据集进行中毒操作，得到中毒样本；并通过该中毒样本训练步骤(2)得到的深度学习网络得到中毒模型；(4)提取中毒模型的输出作为中毒特征；(5)利用步骤(4)定义的中毒特征作为约束条件，训练上游预训练模型，并进行漏洞判定；若训练后的上游预训练模型的输出带有中毒特征，且没有被在线模型市场中的检测器检测到，则判定在线模型市场中的检测器存在漏洞；(6)下游任务供应商下载预训练模型，并对下游数据集进行检查，若下游任务供应商判定下游数据集不存在漏洞，则对预训练模型进行微调，并进行漏洞判定；将带有触发器的测试样本输入到训练好的预训练模型中，若预训练模型的输出均为误标记的类；则判定下游任务供应商先对下游数据集进行检查过程存在漏洞。2.根据权利要求1所述的面向深度模型供应链的多方协作的漏洞判定方法，其特征在于，所述步骤(1)中作为上游任务数据集的图像数据集包括CIFAR
‑
100或GTSRB。3.根据权利要求2所述的面向深度模型供应链的多方协作的漏洞判定方法，其特征在于，所述步骤(2)具体为：使用不同的模型结构对不同的数据集进行训练，其中CIFAR
‑
100数据集使用VGG19模型，GTSRB数据集使用ResNet18模型；将上游任务数据集中的样本及其对应类标输入到神经网络中进行训练，损失函数定义为：其中L
model
表示模型的loss函数，m为训练所使用的样本总数，CE(
·
)表示交叉熵函数，i表示样本的索引值；训练结束后保存模型和训练参数。4.根据权利要求1所述的面向深度模型供应链的多方协作的漏洞判定方法，其特征在于，所述步骤(3)具体包括以下子步骤：(3.1)利用BadNets法对步骤(1)预处理后的上游任务数据集进行中毒操作，得到中毒数据集，具体地：随机选取一部分上游任务数据集，将其类标改为中毒类标0，在对应图像加上触发器图样；(3.2)利用步骤2.1)得到中毒数据集训练步骤(2)得到的神经网络得到中毒模型，其损失函数定义为：L
BD
＝L
model
+CE(y
t
，x
t
)其中，L
model
表示步骤(2)中训练的神经网络的损失函数，y
t
和x
t
为中毒数据集中的中毒类标和触发样本；训练结束后保存模型和训练参数。
(3.3)训练完成后将带有触发器的中毒样本输入至中毒模型，以测试中毒成功率，并...

【专利技术属性】
技术研发人员：陈晋音，陈若曦，金海波，郑海斌，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人