特征提取模型的训练方法、装置、设备、介质及程序产品制造方法及图纸

技术编号:34426515 阅读:33 留言:0更新日期:2022-08-06 15:58
本申请提供一种特征提取模型的训练方法、装置、电子设备、计算机可读存储介质以及计算机程序产品,包括:第一参与方设备获取本地的第一用户特征,并接收第二参与方设备发送的第二用户特征;基于第一用户特征及第二用户特征,对特征提取模型中的共享特征子模型进行训练,得到训练后的共享特征子模型;通过特征提取模型中的本地特征子模型对本地的目标用户样本进行特征提取,得到第一目标特征,并通过训练后的共享特征子模型对目标用户样本进行特征提取,得到第二目标特征;结合第一目标特征及第二目标特征,更新特征提取模型的模型参数。通过本申请,能够保证基于联邦架构下的特征提取模型在进行特征提取时所提取特征的全面性。面性。面性。

【技术实现步骤摘要】
特征提取模型的训练方法、装置、设备、介质及程序产品


[0001]本申请涉及人工智能技术,尤其涉及一种特征提取模型的训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]在传统的纵向联邦场景下,所有参与方设备只能基于各参与方设备对齐的有标签的训练样本进行有监督的联合建模。然而,实际场景中,标签数据较难获得,各参与方设备只有少量的训练样本存在标签,因此能够利用的训练样本数量偏少;同时,由于参与方设备各自场景不同,因此在利用各参与方设备的对齐样本进行联合训练时,容易丢失部分特征信息,从而影响联合建模的效果。

技术实现思路

[0003]本申请实施例提供一种特征提取模型的训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够保证基于联邦架构下的特征提取模型在进行特征提取时所提取特征的全面性。
[0004]本申请实施例的技术方案是这样实现的:
[0005]本申请实施例提供一种特征提取模型的训练方法,基于联邦学习系统,所述联邦学习系统包括第一参与方设备及第二参与方设备,所述特征提取模本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种特征提取模型的训练方法,其特征在于,基于联邦学习系统,所述联邦学习系统包括第一参与方设备及第二参与方设备,所述特征提取模型包括本地特征子模型及共享特征子模型,所述方法包括:第一参与方设备获取本地的第一用户特征,并接收所述第二参与方设备发送的第二用户特征;其中,所述第一用户特征与所述第二用户特征对应相同的用户,所述第一用户特征与所述第二用户特征部分相同;基于所述第一用户特征及所述第二用户特征,对所述共享特征子模型进行训练,得到训练后的共享特征子模型;通过所述本地特征子模型对本地的目标用户样本进行特征提取,得到第一目标特征,并通过所述训练后的共享特征子模型对所述目标用户样本进行特征提取,得到第二目标特征;结合所述第一目标特征及所述第二目标特征,更新所述特征提取模型的模型参数。2.如权利要求1所述的方法,其特征在于,所述结合所述第一目标特征及所述第二目标特征,更新所述特征提取模型的模型参数,包括:确定所述第一目标特征与所述第二目标特征的相似度;基于所述第一目标特征与所述第二目标特征的相似度,确定所述特征提取模型的损失;基于所述损失,更新所述特征提取模型的模型参数。3.如权利要求2所述的方法,其特征在于,所述基于所述第一目标特征与所述第二目标特征的相似度,确定所述特征提取模型的损失,包括:获取所述本地特征子模型的第一损失函数及所述共享特征子模型的第二损失函数,并基于所述第一损失函数及所述第二损失函数构建所述特征提取模型的目标损失函数;基于所述第一目标特征与所述第二目标特征的相似度,确定所述第一损失函数的第一损失、以及所述第二损失函数的第二损失;基于所述第一损失、所述第二损失及所述目标损失函数,确定所述特征提取模型的损失。4.如权利要求1所述的方法,其特征在于,所述目标用户样本通过对训练用户样本进行数据增强得到,所述方法还包括:对所述训练用户样本再次进行数据增强得到增强训练用户样本;对所述特征提取模型进行复制,得到参考特征提取模型;通过所述参考特征提取模型中的本地特征子模型对所述增强训练用户样本进行特征提取,得到第三目标特征,通过所述参考特征提取模型中的共享特征子模型对所述增强训练用户样本进行特征提取,得到第四目标特征;所述结合所述第一目标特征及所述第二目标特征,更新所述特征提取模型的模型参数,包括:结合所述第一目标特征、所述第二目标特征、所述第三目标特征以及所述第四目标特征,更新所述特征提取模型的模型参数。5.如权利要求4所述的方法,其特征在于,所述结合所述第一目标特征、所述第二目标
特征、所述第三目标特征以及所述第四目标特征,更新所述特征提取模型的模型参数,包括:对所述第一目标特征以及所述第二目标特征进行特征拼接,得到第一拼接特征,并对所述第三目标特征以及所述第四目标特征进行特征拼接,得到第二拼接特征;基于所述第一拼接特征以及所述第二拼接特征,采用对比学习的方式,更新所述特征提取模型的模型参数。6.如权利要求1所述的方法,其特征在于,所述方法还包括:获取至少两个训练用户样本,并对所述至少两个训练用户样本中一个训练用户样本进行数据增强,得到第一增强训练用户样本以及第二增强训练用户样本,并将所述第一增强训练用户样本作为所述目标用户样本;通过所述本地特征子模型,对所述第二增强训练用户样本、以及未经过数据增强的训练用户样本分别进行特征提取,得到所述第二增强训练用户样本的第一增强目标特征、以及未经过数据增强的训练用户样本的第二增强目标特征;通过所述训练后的共享特征子模型,对所述第二增强训练用户样本、以及未经过数据增强的训练用户样本分别进行特征提取,得到所述第二增强训练用户样本的第三增强目标特征、以及未经过数据增强的训练用户样本的第...

【专利技术属性】
技术研发人员:康焱何元钦骆家焕
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1