【技术实现步骤摘要】
一种应用于数据异构的联邦域适应方法
[0001]本专利技术属于机器学习的
,具体涉及一种应用于数据异构的联邦域适应方法。
技术介绍
[0002]在无监督的深度学习中,为了避免代价高昂的注释过程,我们通常会使用其他相似的数据集(即源域)来训练可应用到新数据集(即目标域)的模型,这就是域适应问题。传统的域适应方法没有考虑源域数据不可得的问题,为了在不获得源域数据的情况下,训练可应用到目标域的模型,研究者们提出了联邦域适应,将域适应部署在联邦学习的框架上,联邦学习是一种分布式机器学习设置,能使减轻传统集中式机器学习方法的隐私泄露风险和数据传输成本,保证了源域数据的隐私安全。
[0003]传统联邦学习的实现流程主要分为四个部分:
①
每个联邦学习源域节点基于本地源域数据训练得到本地源域模型,
②
上传本地源域模型参数和权重给中央服务器,
③
中央服务器对各个本地源域模型参数进行聚合得到全局模型,
④
最后每个联邦学习源域节点下载全局模型用于下一轮的本地源域 ...
【技术保护点】
【技术特征摘要】
1.一种应用于数据异构的联邦域适应方法,其特征在于:每个联邦源域节点基于相关的本地数据集进行当前轮次训练得到对应的本地源域模型,对所有的本地源域模型进行知识蒸馏,获取高质量知识和支持所述高质量知识的本地源域模型数量,连同所有的本地源域模型共同上传至中央服务器,然后计算每个本地源域模型对应的权重,通过聚合操作建立全局模型,最后中央服务器将全局模型下发至各个源域节点,再结合对比训练方法,进行下一轮次训练得到每个源域节点对应的本地源域模型,依次迭代,直到全局模型收敛,从而完成联邦域的自适应学习。2.根据权利要求1所述的应用于数据异构的联邦域适应方法,其特征在于对所有的本地源域模型进行知识蒸馏的方法包括以下步骤:步骤Ⅰ、记本地源域模型为将目标域D
t
的样本数据相继输入K个的本地源域模型中进行训练学习,计算得到所有类的置信度预测值集合步骤Ⅱ、设置置信度阈值,将无论哪个类的置信度预测值都没有超过置信度阈值的本地源域模型过滤掉;步骤Ⅲ、对于保留下来的本地源域模型,将相同类的置信度预测值进行求和,和数最大的类设置为共鸣类,然后将所述共鸣类的置信度预测值小于置信度阈值对应的本地源域模型过滤掉;步骤Ⅳ、对于再次保留下来的本地源域模型,将对应所有类的置信度预测值进行平均集成,获取高质量知识p
i
,同时记录了支持p
i
的本地源域模型数量3.根据权利要求2所述的应用于数据异构的联邦域适应方法,其特征在于建立全局模型的方法包括以下步骤:步骤
ⅰ
、利用如下方程式,计算每个本地源域模型的权重的权重的权重其中,表示第k个本地源域模型...
【专利技术属性】
技术研发人员:方志军,黄芳,赵晓丽,李兴宸,
申请(专利权)人:上海工程技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。