本发明专利技术提供了一种基于元自训练的鲁棒性无监督域适应方法,第一步,基于自训练范式,通过在源标记数据和目标未标记数据上应用一般的无监督域适应方法和开发的随机掩码增强对源模型进行预训练;第二步,交替进行在伪标记的对抗目标模型训练和通过元步骤微调源模型,其中,自训练的训练机制允许将对抗训练嵌入到无监督域适应过程中,元步骤进一步有助于减轻噪声伪标签的错误传播;应用本技术方案可缓解现实场景中因缺少数据标签而造成模型难以训练的问题。练的问题。练的问题。
【技术实现步骤摘要】
一种基于元自训练的鲁棒性无监督域适应方法
[0001]本专利技术涉及无监督领域适应
,特别是一种基于元自训练的鲁棒性无监督域适应方法。
技术介绍
[0002]无监督领域适应:无监督领域适应旨在将从有标记的源数据中学习到的知识转移到无标记的目标数据中。传统的无监督域适应方法通过最小化学习到的分布差异来探索源数据和目标数据之间的域不变信息。龙等人提出了域自适应网络和联合适应网络,利用最大均值差异来最小化特征差异。最近,生成对抗网络的出现给域适应领域带来了新的启发,提出了域对抗神经网络、条件域对抗网络和最大分类器差异,其中配备了鉴别器来强制生成更具鉴别性的域不变特征。尽管这些方法是有效的,但一个缺点是来自目标域的潜在有意义的训练信息没有得到充分利用。因此,另一个研究领域探索了自训练方案,为目标域生成伪标记,然后利用伪标记的目标数据重新训练模型。为了提高伪标签的质量,人们致力于通过使用渐进生成策略、课程学习和投票方案来降低标签噪声。
[0003]对抗鲁棒性:自从有研究证明难以察觉的扰动可以很容易地欺骗深度模型,深度模型的对抗脆弱性得到了越来越多的关注。最早的工作设计了一种快速梯度符号方法,以产生基于卷积神经网络线性性质的强对抗样本。马德里等人通过将快速梯度符号法中的一步扰动生成改为迭代扰动生成,进一步提出了投影梯度下降攻击,并已成为最经典的对抗性攻击之一。为了应对对抗性例子的威胁,对抗训练已经被发展成为训练健壮模型的范例。它形成为对抗样本生成和模型训练之间的最小
‑
最大博弈。这项工作首先制定了对抗训练过程,他们使用投影梯度下降来生成对抗性示例,并在这些对抗样本上训练模型。后续的研究开发了各种方式以提高对抗训练的鲁棒准确性,如改变对抗样本生成过程、模型参数更新和特征自适应。然而,对抗训练需要标签,因此在无监督域适应设置下不适用。
[0004]无监督域适应模型的对抗鲁棒性:与提高无监督域适应模型准确性的研究相比,很少有人对无监督域适应模型的对抗鲁棒性进行研究。同时,在无监督域适应中引入对抗训练的主要挑战是缺少目标域中的标签信息,而对抗训练需要真实标签来生成对抗样本。为了解决这个问题,现有的方法要么跳过对抗训练,要么使用自我监督的方法来生成对抗样本。例如,直接探索无监督域适应过程中的鲁棒性转移而不是使用对抗训练,提出在无监督域适应过程中使用外部预训练的鲁棒模型进行鲁棒特征蒸馏。尽管它很有效,但它的性能受到教师模型扰动预算的限制,并且对教师模型的结构很敏感。另一方面,罗等人提出使用自监督的对抗样本生成来将对抗训练注射到无监督域适应中。遗憾的是,这种对抗样本生成不能保证对抗训练中的内部最大化,从而导致模型鲁棒性不理想。最近的研究提出了另一种基于朴素自适应训练的图像分割方法。同样,这种简单的伪标签生成是不够正确的,甚至可能危害模型鲁棒性。
技术实现思路
[0005]有鉴于此,本专利技术的目的在于提供一种基于元自训练的鲁棒性无监督域适应方法,将对抗训练引入无监督域适应时目标域的标签缺失问题,并且克服了自训练方法产生的噪声伪标签对模型训练的不良影响,在不损害域适应模型干净准确性的情况下,实现了模型稳健性的显著提升。
[0006]为实现上述目的,本专利技术采用如下技术方案:一种基于元自训练的鲁棒性无监督域适应方法,第一步,基于自训练范式,通过在源标记数据和目标未标记数据上应用一般的无监督域适应方法和开发的随机掩码增强对源模型进行预训练;第二步,交替进行在伪标记的对抗目标模型训练和通过元步骤微调源模型,其中,自训练的训练机制允许将对抗训练嵌入到无监督域适应过程中,元步骤进一步有助于减轻噪声伪标签的错误传播。
[0007]在一较佳的实施例中,所述第一步具体来说:对于给定的带标签源域数据集和无标签目标域数据集应用无监督域适应方法UDA结合提出的随机掩蔽增强RMA对源模型G
s
进行预训练,其中特征提取器F:x
→
f,x为输入图像,f为输出特征,绿色部分为分类器T:f
→
z,z为模型的输出logit;无监督域适应方法用到的目标函数如下式:
[0008][0009]其中为交叉熵损失函数,为不同UDA方法中的域适应函数。
[0010]在一较佳的实施例中,所述第二步具体来说:执行第一步后得到一个训练良好的源模型G
s
,目标模型G
t
由源模型参数初始化;将目标域无标签数据输入预训练源模型,得到目标伪标记然后通过投影梯度下降攻击得到对抗扰动δ,将扰动加在干净样本上得到对抗样本具体计算过程如下式:
[0011][0012]其中由x初始化,最终的对抗样本k
max
为最大迭代次数;
[0013]将得到的对抗样本与伪标签一一对应得到目标数据的对抗样本集将得到的对抗样本与伪标签一一对应得到目标数据的对抗样本集用于对目标模型G
t
进行对抗训练,对抗训练过程中的目标函数为:
[0014][0015]同时通过使用元步骤微调源模型,该元步骤是目标模型G
t
在带标记源数据上的性能的反馈,即:
[0016][0017]与现有技术相比,本专利技术具有以下有益效果:本专利技术主要解决了将对抗训练引入无监督域适应时目标域的标签缺失问题,并且克服了自训练方法产生的噪声伪标签对模型训练的不良影响,在不损害域适应模型干净准确性的情况下,实现了模型稳健性的显著提升。
附图说明
[0018]图1为本专利技术优选实施例的第一步过程展示图;
[0019]图2为本专利技术优选实施例的第二步过程展示图。
具体实施方式
[0020]下面结合附图及实施例对本专利技术做进一步说明。
[0021]应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。
[0022]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式;如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0023]在本专利技术中,基于自训练范式,该系统首先通过在源标记数据和目标未标记数据上应用一般的无监督域适应方法和开发的随机掩码增强对源模型进行预训练,第一阶段方案概述如下图1所示:
[0024]对于给定的带标签源域数据集
①
和无标签目标域数据集
②
应用无监督域适应方法
④
UDA结合提出的随机掩蔽增强
⑤
RMA对源模型
③
G
s
进行预训练,其中
③
中黄色部分为特征提取器F:x
→
f,x为输入图像,f为输出特征,绿色部分为分类器T:f
→...
【技术保护点】
【技术特征摘要】
1.一种基于元自训练的鲁棒性无监督域适应方法,其特征在于:第一步,基于自训练范式,通过在源标记数据和目标未标记数据上应用一般的无监督域适应方法和开发的随机掩码增强对源模型进行预训练;第二步,交替进行在伪标记的对抗目标模型训练和通过元步骤微调源模型,其中,自训练的训练机制允许将对抗训练嵌入到无监督域适应过程中,元步骤进一步有助于减轻噪声伪标签的错误传播。2.根据权利要求1所述的一种基于元自训练的鲁棒性无监督域适应方法,其特征在于,所述第一步具体来说:对于给定的带标签源域数据集所述第一步具体来说:对于给定的带标签源域数据集和无标签目标域数据集应用无监督域适应方法UDA结合提出的随机掩蔽增强RMA对源模型G
s
进行预训练,其中特征提取器F:x
→
f,x为输入图像,f为输出特征,绿色部分为分类器T:f
→
z,z为模型的输出logit;无监督域适应方法用到的目标函数如下式:其中l
ce
为交...
【专利技术属性】
技术研发人员:印佳丽,朱万青,刘西蒙,
申请(专利权)人:福州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。