【技术实现步骤摘要】
一种基于阴影模型的联邦多源域适应方法及系统
[0001]本专利技术属于深度学习的计算机视觉
,具体涉及一种基于阴影模型的联邦多源域适应方法及系统。
技术介绍
[0002]近年来,计算机视觉方面的研究在现实生活中被广泛应用。但在实现过程严重受到大量标记样本数据的约束,而标记数据需要耗费大量的人力、物力和财力。为了解决应用中数据标签不足的问题,无监督域适应相关研究取得了很大的进展。现有方法大多基于同时获取有标记的源域数据以及无标签的目标域数据的前提下完成。传统的无监督多源域适应(UMDA)方法假设可以直接访问所有源域数据集。但这一假设忽略了用户的隐私保护问题,但由于部分信息包含用户的私人生物信息,涉及到用户的隐私问题,如用户的生物信息:指纹,人脸,虹膜等,为了保护用户的数据隐私和安全抵御网络攻击,其中所有数据和计算必须保持分散,保证设备只能访问自身独有的数据。在抵御攻击的过程中,可分为白盒攻击和黑盒攻击,白盒攻击是在可以获取源域数据训练的网络模型参数的情况下进行无监督域适应,但是由于恶意攻击者可以通过对抗的方式对网络模型进 ...
【技术保护点】
【技术特征摘要】
1.一种基于阴影模型的联邦多源域适应方法,其特征在于,包括以下步骤:S1、设计基于阴影模型的联邦多源域适应网络模型;S2、通过最小化标准的交叉熵损失,对步骤S1设计的不同的源域模型进行去中心化预训练,获取K个去中心化训练好的源域模型;S3、对步骤S2获取的K个阴影源域模型,通过获取目标域样本对应的可能性输出,计算不同源域模型输出结果的类间方差,通过归一化处理获取不同源域模型对目标域的贡献占比;S4、对步骤S3获取的不同源域模型对目标域的贡献占比,通过加权计算获取每一个目标域样本的伪标签,并对目标样本赋予伪标签;S5、通过结合协同教学和混淆匹配的方式,对步骤S4得到的伪标签目标样本进行标签噪声学习,依次迭代直到网络T
A
和T
B
收敛,在源域数据、网络参数以及学习梯度均不可知的情况下实现无监督域适应。2.根据权利要求1所述的基于阴影模型的联邦多源域适应方法,其特征在于,步骤S1中,基于阴影模型的联邦多源域适应网络模型中,有标记的源域和目标域分别由K个有标签的源域数据集和一个无标签的目标域D
T
表示;源域和目标域具有相同的类别个数C,且所有的源域数据和标签以及目标域样本均不共享。3.根据权利要求1所述的基于阴影模型的联邦多源域适应方法,其特征在于,步骤S2中,交叉熵损失如下:其中,表示soft
‑
max输出层对应的C维向量的第c个元素的值,q表示的y
k
的one
‑
hot编码,q
c
为样本x
k
的标签y
k
对应的one
‑
hot编码的第c个元素的值,S
k
(x
k
)为当源域样本x
k
输入到附图1所示的网络S
k
时对应的输出结果,C为输入图像样本的类别总个数。4.根据权利要求1所述的基于阴影模型的联邦多源域适应方法,其特征在于,步骤S3具体为:S301、根据步骤S2获取的K个训练好的阴影源域模型,通过输入目标域样本X
T
获取样本属于不同类别的概率输出;S302、使用同类别软概率的类方差作为评价指标来评价不同模型对目标域样本的分类能力,计算得到第k个阴影源模型中软概率的类间方差的均值。5.根据权利要求4所述的基于阴影模型的联邦多源域适应方法,其特征在于,步骤S301中,soft
‑
max层的输出为:其中,S
k
为第k个源域图像训练的第k个源域网络,X
T
为目标域图像样本。
6.根据权利要求4所述的基于阴影模型的联邦多源域适应方法,其特征在于,步骤S302中,第k个阴影源模型中软概率的类间方差的均值σ
k
为:其中,C为图像样本的类别总个数,为真实类别c对应概率集的均值,为所有类别c对应的概率集的均值,为非类别c对应的概率集的均值,ω<...
【专利技术属性】
技术研发人员:刘新慧,惠维,白改瑞,刘志林,赵季中,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。