基于对抗训练网络的后门水印图像数据集生成方法技术

技术编号：36191544 阅读：55 留言：0更新日期：2022-12-31 21:08

本发明专利技术公开了一种基于对抗训练网络的后门水印图像数据集生成方法。该方法是通过分别构建生成器网络和鉴别器网络，并对两个网络进行对抗训练，得到的图片样本被鉴别器以50％的概率判定为真实图片样本，以50％的概率判定为生成器生成的假样本，使得本发明专利技术的后门水印图像数据集与真实图片样本集统计分布相似，不易被攻击者检测到，具有隐蔽性较强的优点；同时，本发明专利技术的后门水印图像数据集修改生成器网络生成的所有假样本的标签，没有引入无效或者错误特征，不会影响图像分类模型在原始任务上的精度，图像分类模型在原始任务上的决策边界没有改变，图像分类模型在原始任务上仍保持高精度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
基于对抗训练网络的后门水印图像数据集生成方法

[0001]本专利技术属于图像处理
，更进一步涉及神经网络水印领域中的一种基于对抗训练网络的后门水印图像数据集生成方法。本专利技术可用于图像分类模型在黑盒场景下的版权保护，用一种不可见的方式生成后门水印图像数据集，当出现模型版权纠纷时，模型使用者可通过验证水印信息声明所有权。

技术介绍

[0002]水印作为模型版权保护的一种方式，在黑盒场景中得到广泛应用。目前，基于后门的设计是通过构造一个特定的后门水印图像数据集，后门水印图像数据集通常由一组图片样本和对应的特定标签组成，特定输入与其标签之间的映射被视为后门并用作水印，用该后门水印图像数据集微调训练好的图像分类模型，使该模型含有水印信息，图像分类模型可以将后门水印图像数据集中图片样本预测为特定标签；模型使用者用后门水印图像数据集对可疑模型发起预测查询，如果检测到水印信息，模型使用者可以声明模型的所有权。
[0003]然而在现实场景下，攻击者可以通过一系列手段例如查询修改攻击检测到后门样本，从而躲避检测。另外，目前的后门水印技术中后门水印不可避免对模型的原始任务产生影响，导致含有后门水印的图像分类模型分类精度低。因此，水印应该足够隐蔽，不易被攻击者检测，同时，后门水印不应该影响原始模型的准确性，而目前的神经网络模型后门水印技术很难同时兼顾保真度和隐蔽性。
[0004]华南师范大学在其申请的专利文献“一种神经网络水印嵌入方法、装置、电子设备及存储介质”(申请号：202210016799.8申请公布号：CN...

【技术保护点】

【技术特征摘要】
1.一种基于对抗训练网络的后门水印图像数据集生成方法，其特征在于，分别构建生成器网络和鉴别器网络，对生成器网络和鉴别器网络进行对抗训练，生成后门水印图像数据集，该方法的步骤包括如下：步骤1，构建生成器网络：构建一个由5个全连接层级联的生成器网络，将第一至第五全连接层的输入神经元个数依次设置为100，128，256，512，1024，输出神经元个数依次设置为128，256，512，1024，784；第一至第四全连接层的激活函数均采用Relu函数实现，第五全连接层的激活函数采用tanh函数实现；步骤2，构建鉴别器网络：构建一个由3个全连接层级联的鉴别器网络，将第一至第三全连接层的输入神经元个数依次设置为784，512，256，输出神经元个数依次设置为512，256，1；第一，第二全连接层的激活函数均采用Relu函数实现，第三全连接层的激活函数采用Sigmoid函数实现；步骤3，生成图片样本集和噪声样本集：步骤3.1，将包含C个目标类别的N幅图像中的一半图像及其标签组成图片样本集，其中，C≥2，N≥2000；步骤3.2，随机生成符合高斯分布的包含有m个噪声的噪声样本集，每个噪声样本的维度为100，其中，m的取值与N相同；步骤4，对生成器网络和鉴别器网络进行对抗训练：步骤4.1，将噪声样本集输入到生成器网络中，通过生成器网络对每个噪声样本进行非线性映射，将映射后的所有噪声样本组成假样本集；将假样本集输入到鉴别器网络中，输出每个假样本的预测值；将图片样本集输入到鉴别器网络中，输出每个图片样本的预测值；步骤4.2，计算所有噪声样本输入到生成器网络后输出的噪声样本平均损失值，计算所有图片样本和所有假样本输入到鉴别器网络后输出的样本平均损失值，分别计算生成器网络和鉴别器网络损失函数的梯度，采用梯度下降算法，对生成器网络和鉴别器网络的参数进行交替更新，直至噪声样本平均损失值和样本平均损失值均不再变化为止，得到训练好的生成器网络和鉴别器网络；步骤5，生成后门水印图像数据集：修改生成器网络和鉴别器网络均训练好时生成器网络输出的每...

【专利技术属性】
技术研发人员：朱笑岩，谢雨欣，马建峰，韩雪雪，张琳杰，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人