一种基于领域自适应与联邦学习的模型训练方法及系统技术方案

技术编号:25837503 阅读:27 留言:0更新日期:2020-10-02 14:18
公开了一种基于领域自适应与联邦学习的模型训练方法及系统。一方面,采用联邦学习架构,使得源业务方与目标业务方可以在不彼此交互数据隐私的情况下联合训练模型,保护了双方的数据隐私。另一方面,针对目标业务领域的样本集缺乏准确标签的情况,利用源业务领域的样本集的特征与标签之间的映射关系进行迁移学习,本质上是将源业务领域下训练的模型适应到目标业务领域下。

【技术实现步骤摘要】
一种基于领域自适应与联邦学习的模型训练方法及系统
本说明书实施例涉及信息
,尤其涉及一种基于领域自适应与联邦学习的模型训练方法及系统。
技术介绍
随着神经网络算法的发展,业务方可以基于在自身业务领域下沉淀的大量数据,采用神经网络算法进行模型训练,利用训练得到的模型对该业务领域下的业务对象进行类型识别。此外,业务方往往还会基于自己的模型,为相似业务领域的其他业务方提供模型识别服务,这些其他业务方往往缺乏对样本的标签进行准确标注的能力,因此很难训练自己的模型。本文为了描述的方便,将有能力训练自身模型的业务方称为源业务方,将源业务方的业务领域称为源业务领域;将难以训练自己的模型的业务方称为目标业务方,将目标业务方的业务领域称为目标业务领域。需要说明的是,源业务领域与目标业务领域虽然不同,但比较相似。然而,源业务领域与目标业务领域下的样本特征分布存在一定差异,这意味着,基于源业务领域的样本训练得到的模型,在应用于目标业务领域时,识别效果并不好。此外,源业务方与目标业务方也不愿向彼此提供自己的数据用于模型参数调整(fine-turning)。基于此,需要一种实现对目标业务领域下的业务对象的类型进行准确识别,同时兼顾各业务方的数据隐私需求的技术方案。
技术实现思路
为了解决缺少一种实现对目标业务领域下的业务对象的类型进行准确识别,同时兼顾各业务方的数据隐私需求的技术方案的技术问题,本说明书实施例提供一种基于领域自适应与联邦学习的模型训练方法及系统,技术方案如下:根据本说明书实施例的第1方面,提供一种基于领域自适应与联邦学习的模型训练方法,源业务方设备与目标业务方设备上分别部署有初始化的神经网络模型,所述方法包括:迭代执行以下步骤,直至满足训练停止条件:源业务方设备将源业务领域的已标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为源映射特征集,并计算本地训练梯度;将所述本地训练梯度与所述源映射特征集上传给训练协调方设备;目标业务方设备将目标业务领域的未标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为目标映射特征集;将所述目标映射特征集上传给训练协调方设备;所述训练协调方设备基于所述本地梯度、所述源映射特征集以及所述目标映射特征集,计算综合训练梯度,并实现:根据所述综合训练梯度更新所述源业务方设备与所述目标业务方设备的神经网络模型;其中,所述综合训练梯度,正相关于所述源映射特征集与所述目标映射特征集之间的特征分布差异,且正相关于所述本地梯度。根据本说明书实施例的第2方面,提供一种基于领域自适应与联邦学习的模型训练方法,源业务方设备与对应于不同目标业务方的至少两个目标业务方设备上分别部署有初始化的神经网络模型,所述方法包括:迭代执行以下步骤,直至满足训练停止条件:源业务方设备将源业务领域的已标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为源映射特征集,并计算本地训练梯度;将所述本地训练梯度与所述源映射特征集上传给训练协调方设备;针对每个目标业务方设备,该目标业务方设备将对应的目标业务领域的未标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为对应的目标映射特征集,将对应的目标映射特征集上传给训练协调方设备;所述训练协调方设备基于所述本地梯度、所述源映射特征集、以及每个目标业务方设备对应的目标映射特征集,计算综合训练梯度,并实现:根据所述综合训练梯度更新所述源业务方设备与每个目标业务方设备的神经网络模型;其中,所述综合训练梯度,正相关于所述源映射特征集与每个目标映射特征集之间的特征分布差异,且正相关于所述本地梯度。根据本说明书实施例的第3方面,提供一种基于领域自适应与联邦学习的模型训练系统,包括源业务方设备、目标业务方设备与训练协调方设备;其中,源业务方设备与目标业务方设备上分别部署有初始化的神经网络模型;迭代执行以下步骤,直至满足训练停止条件:源业务方设备,将源业务领域的已标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为源映射特征集,并计算本地训练梯度;将所述本地训练梯度与所述源映射特征集上传给训练协调方设备;目标业务方设备,将目标业务领域的未标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为目标映射特征集;将所述目标映射特征集上传给训练协调方设备;训练协调方设备,基于所述本地梯度、所述源映射特征集、所述目标映射特征集,计算综合训练梯度,并实现:根据所述综合训练梯度更新所述源业务方设备与所述目标业务方设备的神经网络模型;其中,所述综合训练梯度,正相关于所述源映射特征集与所述目标映射特征集之间的特征分布差异,且正相关于所述本地梯度。根据本说明书实施例的第4方面,提供一种基于领域自适应与联邦学习的模型训练系统,包括源业务方设备与对应于不同目标业务方的至少两个目标业务方设备,所述源业务方设备与每个目标业务方设备上分别部署有初始化的神经网络模型,所述方法包括:迭代执行以下步骤,直至满足训练停止条件:源业务方设备,将源业务领域的已标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为源映射特征集,并计算本地训练梯度;将所述本地训练梯度与所述源映射特征集上传给训练协调方设备;每个目标业务方设备,将对应的目标业务领域的未标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为对应的目标映射特征集,将对应的目标映射特征集上传给训练协调方设备;所述训练协调方设备,基于所述本地梯度、所述源映射特征集、以及每个目标业务方设备对应的目标映射特征集,计算综合训练梯度,并实现:根据所述综合训练梯度更新所述源业务方设备与每个目标业务方设备的神经网络模型;其中,所述综合训练梯度,正相关于所述源映射特征集与每个目标映射特征集之间的特征分布差异,且正相关于所述本地梯度。本说明书实施例所提供的技术方案,一方面,采用联邦学习架构,使得源业务方与目标业务方可以在不彼此交互数据隐私的情况下联合训练模型,保护了双方的数据隐私。另一方面,针对目标业务领域的样本集缺乏准确标签的情况,利用源业务领域的样本集的特征与标签之间的映射关系进行迁移学习,本质上是将源业务领域下训练的模型适应到目标业务领域下,在具体实现上,将源业务领域的样本集的特征与目标业务领域的样本集的特征都映射到神经网络隐层的特征空间,不仅以“最小化源业务领域下的模型训练损失”为模型训练的优化指标,还以“最小化该特征空间内原业务领域的样本集与目标业务领域的样本集之间的特征分布差异”为模型训练的优化指标,从而使得训练得到的模型不仅对原业务领域下的业务对象有较好的识别效果,而且对目标业务领域下的业务对象有较好的识别效果。应当理解的是,以上的一般描本文档来自技高网...

【技术保护点】
1.一种基于领域自适应与联邦学习的模型训练方法,源业务方设备与目标业务方设备上分别部署有初始化的神经网络模型,所述方法包括:/n迭代执行以下步骤,直至满足训练停止条件:/n源业务方设备将源业务领域的已标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为源映射特征集,并计算本地训练梯度;将所述本地训练梯度与所述源映射特征集上传给训练协调方设备;/n目标业务方设备将目标业务领域的未标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为目标映射特征集;将所述目标映射特征集上传给训练协调方设备;/n所述训练协调方设备基于所述本地梯度、所述源映射特征集以及所述目标映射特征集,计算综合训练梯度,并实现:根据所述综合训练梯度更新所述源业务方设备与所述目标业务方设备的神经网络模型;/n其中,所述综合训练梯度,正相关于所述源映射特征集与所述目标映射特征集之间的特征分布差异,且正相关于所述本地梯度。/n

【技术特征摘要】
1.一种基于领域自适应与联邦学习的模型训练方法,源业务方设备与目标业务方设备上分别部署有初始化的神经网络模型,所述方法包括:
迭代执行以下步骤,直至满足训练停止条件:
源业务方设备将源业务领域的已标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为源映射特征集,并计算本地训练梯度;将所述本地训练梯度与所述源映射特征集上传给训练协调方设备;
目标业务方设备将目标业务领域的未标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为目标映射特征集;将所述目标映射特征集上传给训练协调方设备;
所述训练协调方设备基于所述本地梯度、所述源映射特征集以及所述目标映射特征集,计算综合训练梯度,并实现:根据所述综合训练梯度更新所述源业务方设备与所述目标业务方设备的神经网络模型;
其中,所述综合训练梯度,正相关于所述源映射特征集与所述目标映射特征集之间的特征分布差异,且正相关于所述本地梯度。


2.如权利要求1所述的方法,所述源业务方设备将所述本地训练梯度与所述源映射特征集上传给训练协调方设备,包括:
所述源业务方设备基于差分隐私保护技术,分别对所述本地训练梯度与所述源映射特征集进行加噪;将加噪后的所述本地训练梯度与加噪后的所述源映射特征集上传给训练协调方设备;
所述目标业务方设备将所述目标映射特征集上传给训练协调方设备,包括:
所述目标业务方设备基于差分隐私保护技术,对所述目标映射特征集进行加噪;将加噪后的所述目标映射特征集上传给训练协调方设备;
所述训练协调方设备基于所述本地梯度、所述源映射特征集、所述目标映射特征集,计算综合训练梯度,包括:
所述训练协调方设备基于加噪后的所述本地梯度、加噪后的所述源映射特征集、加噪后的所述目标映射特征集,计算综合训练梯度。


3.如权利要求1所述的方法,根据所述综合训练梯度更新所述源业务方设备与所述目标业务方设备的神经网络模型,包括:
所述训练协调方设备根据所述综合训练梯度更新神经网络模型,并将更新后的模型参数集分别下发给所述源业务方设备与所述目标业务方设备;
所述源业务方设备根据接收到的模型参数集更新本地的神经网络模型;所述目标业务方设备根据接收到的模型参数集更新本地的神经网络模型。


4.如权利要求1所述的方法,根据所述综合训练梯度更新所述源业务方设备与所述目标业务方设备的神经网络模型,包括:
所述训练协调方设备将所述综合训练梯度分别下发给所述源业务方设备与所述目标业务方设备;
所述源业务方设备根据接收到的综合训练梯度更新本地的神经网络模型;所述目标业务方设备根据接收到的综合训练梯度更新本地的神经网络模型。


5.如权利要求1所述的方法,所述方法还包括:
在一次迭代中,所述源业务方设备计算本地训练损失,并将所述本地训练损失上传给训练协调方设备;
所述训练协调方设备基于所述本地训练损失、所述源映射特征集、所述目标映射特征集,计算综合训练损失,并根据所述综合训练损失,判断是否满足训练停止条件;
其中,所述综合训练损失,正相关于所述源映射特征集与所述目标映射特征集的之间的特征分布差异,且正相关于所述本地训练损失。


6.一种基于领域自适应与联邦学习的模型训练方法,源业务方设备与对应于不同目标业务方的至少两个目标业务方设备上分别部署有初始化的神经网络模型,所述方法包括:
迭代执行以下步骤,直至满足训练停止条件:
源业务方设备将源业务领域的已标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为源映射特征集,并计算本地训练梯度;将所述本地训练梯度与所述源映射特征集上传给训练协调方设备;
针对每个目标业务方设备,该目标业务方设备将对应的目标业务领域的未标注样本集的特征集输入到的本地的神经网络模型,获取本地的神经网络模型的隐层输出,作为对应的目标映射特征集,将对应的目标映射特征集上传给训练协调方设备;
所述训练协调方设备基于所述本地梯度、所述源映射特征集、以及每个目标业务方设备对应的目标映射特征集,计算综合训练梯度,并实现:根据所述综合训练梯度更新所述源业务方设备与每个目标业务方设备的神经网络模型;
其中,所述综合训练梯度,正相关于所述源映射特征集与每个目标映射特征集之间的特征分布差异,且正相关于所述本地梯度。


7.如权利要求6所述的方法,所述源业务方设备将所述本地...

【专利技术属性】
技术研发人员:宫明明汲小溪曾小英王维强
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1