【技术实现步骤摘要】
金融产品的联邦推荐方法、装置、终端设备及介质
[0001]本专利技术适用于金融业务领域,尤其涉及一种金融产品的联邦推荐方法
、
装置
、
终端设备及介质
。
技术介绍
[0002]现有技术的金融产品推荐系统中,用户的数据通常指用户对金融产品的交互行为和个人信息,无论是数据实例的维度还是数据实例的数量,数据越多往往能够取得越好的效果
。
因此,部分推荐机构将一些具有相同用户群体的应用组成推荐数据联盟,进而共享彼此的用户数据,已经成为行业内常见的做法
。
与此同时随着公众对隐私安全需求的增加和数据隐私相关法律法规的颁布,对如何为用户提供精确推荐的同时又能保护数据隐私带来了新的挑战
。
[0003]为了解决以上问题,存在将联邦学习技术应用于金融产品推荐场景的方法,使得原始数据在不离开本地前提下仍能得到良好的个性化服务,但是联邦推荐算法存在以下问题:联邦学习参与方的数据异质性或数据量不同等情况,可能会造成模型质量下降,使物品的推荐准确度降低;并且,由于中心服务器和客户端的目标不同,中心服务器追求的是一般化模型,而客户端最求的是个性化模型,客户最终可能只能得到质量很差的物品推荐结果
。
技术实现思路
[0004]有鉴于此,本专利技术实施例提供了一种金融产品的联邦推荐方法
、
装置
、
终端设备及介质,以解决现有物品推荐方法的推荐准确率低,用户体验差的问题
。
[0005 ...
【技术保护点】
【技术特征摘要】
1.
一种金融产品的联邦推荐方法,其特征在于,所述联邦推荐方法应用于
N
个客户端,
N≥2
,所述联邦推荐方法包括以下步骤:获取目标用户的用户特征,以及
M
个备选物品的物品特征,
M≥2
,对所述用户特征和物品特征进行处理,得到目标用户对备选物品的特征序列;将所述目标用户对备选物品的特征序列输入至各个客户端中训练好的第一物品推荐模型中,得到目标用户对物品的推荐结果;所述第一物品推荐模型的训练过程包括:获取服务端发送的物品推荐模型参数,利用所述物品推荐模型参数更新预设的第二物品推荐模型;获取用户对备选物品的样本特征序列,将所述样本特征序列分别输入至所述第二物品推荐模型和初始化的第一物品推荐模型中,将所述第二物品推荐模型作为教师模型
、
所述第一物品推荐模型作为学生模型,进行一次知识蒸馏训练,得到一次知识蒸馏训练后的第一物品推荐模型和第二物品推荐模型;将所述知识蒸馏训练后的第二物品推荐模型的参数发送至所述服务端,供所述服务端中的联邦学习模型对各个客户端发送的第二物品推荐模型的参数进行处理,以输出更新的物品推荐模型参数;重复上述步骤,再次从所述服务端获取所述更新的物品推荐模型参数,更新所述第二物品推荐模型,并进行下一次知识蒸馏训练;直至满足预设条件,输出训练好的第一物品推荐模型
。2.
根据权利要求1所述的金融产品的联邦推荐方法,其特征在于,供所述服务端中的联邦学习模型对各个客户端发送的第二物品推荐模型的参数进行处理,以输出更新的物品推荐模型参数包括:获取各个客户端发送的第二物品推荐模型的参数,对所有客户端发送的第二物品推荐模型的参数进行聚合后再求平均值,得到更新的物品推荐模型参数,输出所述更新的物品推荐模型参数
。3.
根据权利要求1所述的金融产品的联邦推荐方法,其特征在于,将所述第二物品推荐模型作为教师模型
、
所述第一物品推荐模型作为学生模型,进行一次知识蒸馏训练,得到一次知识蒸馏训练后的第一物品推荐模型和第二物品推荐模型包括:利用所述第一物品推荐模型
、
所述第二物品推荐模型和所述样本特征序列,得到用户对物品的第一样本推荐结果预测值
、
第二样本推荐结果预测值,以及标签预测值;利用所述第一样本推荐结果预测值和所述样本特征序列的真实标签值,计算得到第一损失;利用所述第二样本推荐结果预测值和所述标签预测值,计算第二损失;利用所述第一样本推荐结果预测值
、
第二样本推荐结果预测值和所述真实标签值,计算用于表征所述第二样本推荐结果预测值相对于所述第一样本推荐结果预测值之间差异性的第一
KL
散度,用于表征所述第一样本推荐结果预测值相对于所述第二样本推荐结果预测值之间差异性的第二
KL
散度;利用所述第一损失和所述第一
KL
散度计算所述第一物品推荐模型的损失,利用所述第二损失和所述第二
KL
散度计算所述第二物品推荐模型的损失,用于进行所述知识蒸馏训
练,得到一次知识蒸馏训练后的第一物品推荐模型和第二物品推荐模型
。4.
根据权利要求1所述的金融产品的联邦推荐方法,其特征在于,所述联邦推荐方法还包括以下步骤:将所述目标用户对备选物品的特征序列输入至各个客户端中训练好的第三物品推荐模型中,得到目标用户对物品的备用推荐结果;所述第一物品推荐模型和第三物品推荐模型的训练过程包括:获取所述服务端发送的物品推荐模型参数,利用所述物品推荐模型参数更新预设的第二物品推荐模型;获取用户对备选物品的样本特征序列,将所述样本特征序列分别输入至所述第二物品推荐模型和初始化的第一物品推荐模型中,将所述第二物品推荐模型作为教师模型,将所述第一物品推荐模型和所述第三物品推荐模型作为学生模型,进行一次知识蒸馏训练,得到一次知识蒸馏训练后的第一物品推荐模型
、
第二物品推荐模型和第三物品推荐模型;将所述知识蒸馏训练后的第二物品推荐模型的参数发送至所述服务端,供所述服务端中的联邦学习模型对各个客户端发送的第二物品推荐模型的参数进行处理,以输出更新的物品推荐模型参数;重复上述步骤,再次从所述服务端获取所述更新的物品推荐模型参数,更新所述第二物品推荐模型,并进行下一次知识蒸馏训练;直至满足预设条件,输出训练好的第一物品推荐模型和第三物品推荐模型
。5.
根据权利要求4所述的金融产品的联邦推荐方法,其特征在于,将所述第二物品推荐模型作为教师模型,将所述第一物品推荐模型和所述第三物品推荐...
【专利技术属性】
技术研发人员:岑志彬,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。