一种基于自动虚拟数据增强的隐写分析器的训练方法技术

技术编号:36694143 阅读:15 留言:0更新日期:2023-02-27 20:04
本发明专利技术公开了一种基于自动虚拟数据增强的隐写分析器的训练方法,包括:利用增强网络对批处理样本图像集进行图像数据增强,得到增强噪声的概率分布;利用可微采样器对增强噪声的概率分布进行采样得到增强噪声和增广图像集;利用隐写分析器分别处理批处理样本图像集和增广图像集,并利用隐写分析器的损失函数计算第一损失值,通过梯度下降方法进行梯度反向传播来更新隐写分析器的参数;利用参数更新后的隐写分析器和类别保持器分别处理增广数据集,并利用稳定器处理增强噪声;利用增强网络的损失函数计算第二损失值,并通过梯度下降方法进行梯度反向传播来更新增强网络的参数;迭代进行操作上述操作,得到训练完成的隐写分析器。器。器。

【技术实现步骤摘要】
一种基于自动虚拟数据增强的隐写分析器的训练方法


[0001]本专利技术涉及隐写分析
,尤其涉及一种基于自动虚拟数据增强的隐写分析器的训练方法、基于自动虚拟数据增强的隐写分析器的识别方法、电子设备以及存储介质。

技术介绍

[0002]隐写分析是一种针对隐写术的防御技术。早期的隐写分析方法依赖于人工启发式的方法提取特征,并基于机器学习分类器进行分类。事实上,数字图像隐写分析可以看作是一个二元分类问题。受深度学习在计算机视觉领域中分类任务取得巨大成功的启发,隐写分析的重点也转向了深度学习。近年来,深度学习隐写分析的性能迅速攀升,并显著超过了基于手工特征的隐写分析。然而,深度学习模型是数据驱动的。在现实世界中,隐写分析者可能无法获得足够的数据。数据受限时,模型容易过拟合。数据增强是缓解过拟合、提高深度学习模型性能的有效方法。
[0003]许多隐写分析的数据增强方法已经被提出。这些方法可以分为载体扩充法和虚拟增强法。载体扩充法是指引入或创造出更多的载体图像,然后使用相同的隐写算法生成相应的载密图像,形成更多的载体载密对。这在训练隐写分析器之前执行。添加分布相近的数据集、pixels

off和DPAA是载体扩充的代表性方法。虚拟增强方法在训练过程中对载体图像和载密图像进行某种变换。这些方法包括旋转和翻转、BitMix和CutOut等。它们可以灵活地插入端到端训练过程中。
[0004]然而,现有的深度学习隐写分析虚拟增强方法都是启发式设计,依赖于专家知识。相比之下,在计算机视觉领域中已经提出了许多自动数据增强方法,但它们不能直接应用于隐写分析,因为这两个任务的关注点是不同的。CV(Computer Vision)任务关注的是语义信息,而隐写分析关注的是主要分布在图像纹理区域的细微隐写信号。上述自动增强方法对语义信息的改变不大,但很容易消除隐写信号。

技术实现思路

[0005]鉴于上述问题,本专利技术提供了一种基于自动虚拟数据增强的隐写分析器的训练方法、基于自动虚拟数据增强的隐写分析器的识别方法、电子设备以及存储介质,以期至少能够解决上述问题之一。
[0006]根据本专利技术第一个方面,提供了一种基于自动虚拟数据增强的隐写分析器的训练方法,包括:
[0007]操作一,根据预设采样数量,对训练样本图像集进行随机采样,得到批处理样本图像集;
[0008]操作二,利用增强网络对批处理样本图像集进行图像数据增强,得到增强噪声的概率分布;
[0009]操作三,利用可微采样器对增强噪声的概率分布进行采样得到增强噪声,并根据增强噪声、批处理样本图像集和预设的增强噪声幅度的超参数,得到增广图像集;
[0010]操作四,利用隐写分析器分别处理批处理样本图像集和增广图像集,得到第一处理结果和第二处理结果,其中,隐写分析器基于深度图神经网络构建;
[0011]操作五,利用隐写分析器的损失函数计算第一处理结果和第二处理结果的第一损失值,并根据第一损失值,通过梯度下降方法进行梯度反向传播来更新隐写分析器的参数;
[0012]操作六,利用参数更新后的隐写分析器和类别保持器分别处理增广数据集,得到第三处理结果,并利用稳定器处理增强噪声,得到第四处理结果,其中,类别保持器与隐写分析器具有相同的网络结构但参数不同;
[0013]操作七,利用增强网络的损失函数计算第三处理结果和第四处理结果的第二损失值,并根据第二损失值,通过梯度下降方法进行梯度反向传播来更新增强网络的参数;
[0014]迭代进行操作一至操作七,直到隐写分析器的参数满足预设收敛条件,得到训练完成的隐写分析器。
[0015]根据本专利技术的实施例,上述利用增强网络对批处理样本图像集进行图像数据增强,得到增强噪声的概率分布包括:
[0016]将批处理样本图像集中的图像数据输入到增强网络中进行下采样卷积处理,并将得到的卷积特征向量作为下一轮下采样卷积处理操作的输入向量;
[0017]根据预设的下采样次数,迭代进行输入操作和下采样卷积处理操作,得到多个具有不同特征维度的卷积特征向量;
[0018]从多个具有不同特征维度的卷积特征向量中选取具有第一预设特征维度的卷积特征向量输入到增强网络中进行上采样反卷积处理,将得到的反卷积特征向量与反卷积特征向量具有相同特征维度的卷积特征向量进行向量拼接,得到融合特征向量,并将融合特征向量作为下一轮上采样反卷积处理操作的输入向量;
[0019]根据预设的下采样次数,迭代进行输入操作、上采样反卷积处理操作和向量拼接操作,得到多个具有不同特征维度的融合特征向量;
[0020]从多个具有不同特征维度的融合特征向量中选取具有第二预设特征维度的融合特征向量,并利用饱和激活函数和非饱和激活函数先后处理选中的融合特征向量,得到增强噪声的概率分布。
[0021]根据本专利技术的实施例,上述利用可微采样器对增强噪声的概率分布进行采样得到增强噪声,并根据增强噪声、批处理样本图像集和预设的增强噪声幅度的超参数,得到增广图像集包括:
[0022]根据Gumbel

Softmax方法,得到增强噪声概率分布与增强噪声的关系;
[0023]根据增强噪声概率分布与增强噪声的关系,利用可微采样器对增强噪声的概率分布进行随机采样,得到增强噪声;
[0024]将增强噪声与预设的增强噪声幅度的超参数进行向量相乘,并将相乘得到的向量与批处理样本图像集中的图像数据进行向量运算,得到增广图像集。
[0025]根据本专利技术的实施例,上述增强噪声概率分布与增强噪声的关系由公式(1)确定:
[0026][0027]其中,n
ij
表示增强噪声,和分别表示加性噪声和减性噪声的概率,表示
不添加噪声的概率,由公式(2)确定:
[0028][0029]其中,Uniform(0,1)表示0到1范围内的均匀分布。
[0030]根据本专利技术的实施例,上述稳定器的损失函数由公式(3)确定:
[0031][0032]其中,n
ij
表示所述增强噪声;n0为超参数,表示增强噪声的期望数量。
[0033]根据本专利技术的实施例,上述增强网络的损失函数包括隐写分析器的损失函数、类别保持器的损失函数和稳定器的损失函数。
[0034]根据本专利技术的实施例,上述基于自动虚拟数据增强的隐写分析器的训练方法还包括:
[0035]在增强网络存在多个的情况下,根据增强网络的数量,分别利用增强网络以及与增强网络相对应的可微迭代进行增强噪声的概率分布获取操作和增强噪声的获取操作,得到增强噪声集合;
[0036]在每轮次的隐写分析器训练过程中,执行如下操作:
[0037]根据增强网络的数量随机生成第一随机数和第二随机数;
[0038]根据第一随机数选择增强网络和增强噪声;
[0039]根据第二随机数选择预设的增强噪声幅度的超参数;
[0040]根据选中的增强网络、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自动虚拟数据增强的隐写分析器的训练方法,包括:操作一,根据预设采样数量,对训练样本图像集进行随机采样,得到批处理样本图像集;操作二,利用增强网络对所述批处理样本图像集进行图像数据增强,得到增强噪声的概率分布;操作三,利用可微采样器对所述增强噪声的概率分布进行采样得到增强噪声,并根据所述增强噪声、所述批处理样本图像集和预设的增强噪声幅度的超参数,得到增广图像集;操作四,利用所述隐写分析器分别处理所述批处理样本图像集和所述增广图像集,得到第一处理结果和第二处理结果,其中,所述隐写分析器基于深度图神经网络构建;操作五,利用所述隐写分析器的损失函数计算所述第一处理结果和所述第二处理结果的第一损失值,并根据所述第一损失值,通过梯度下降方法进行梯度反向传播来更新所述隐写分析器的参数;操作六,利用参数更新后的隐写分析器和类别保持器分别处理所述增广数据集,得到第三处理结果,并利用稳定器处理所述增强噪声,得到第四处理结果,其中,所述类别保持器与所述隐写分析器具有相同的网络结构但参数不同;操作七,利用所述增强网络的损失函数计算所述第三处理结果和所述第四处理结果的第二损失值,并根据所述第二损失值,通过梯度下降方法进行梯度反向传播来更新所述增强网络的参数;迭代进行操作一至操作七,直到所述隐写分析器的参数满足预设收敛条件,得到训练完成的隐写分析器。2.根据权利要求1所述的方法,其中,所述利用增强网络对所述批处理样本图像集进行图像数据增强,得到增强噪声的概率分布包括:将所述批处理样本图像集中的图像数据输入到所述增强网络中进行下采样卷积处理,并将得到的卷积特征向量作为下一轮下采样卷积处理操作的输入向量;根据预设的下采样次数,迭代进行输入操作和下采样卷积处理操作,得到多个具有不同特征维度的卷积特征向量;从所述多个具有不同特征维度的卷积特征向量中选取具有第一预设特征维度的卷积特征向量输入到所述增强网络中进行上采样反卷积处理,将得到的反卷积特征向量与所述反卷积特征向量具有相同特征维度的卷积特征向量进行向量拼接,得到融合特征向量,并将所述融合特征向量作为下一轮上采样反卷积处理操作的输入向量;根据预设的下采样次数,迭代进行输入操作、上采样反卷积处理操作和向量拼接操作,得到多个具有不同特征维度的融合特征向量;从所述多个具有不同特征维度的融合特征向量中选取具有第二预设特征维度的融合特征向量,并利用饱和激活函数和非饱和激活函数先后处理选中的融合特征向量,得到所述增强噪声的概率分布。3.根据权利要求1所述的方法,其中,所述利用可微采样器对所述增强噪声的概率分布进行采样得到增强噪声,并根据所述增强噪声、所述批处理样本图...

【专利技术属性】
技术研发人员:陈可江张卫明俞能海张建嵩
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1