金融产品的联邦推荐方法技术

技术编号:39747682 阅读:9 留言:0更新日期:2023-12-17 23:45
本发明专利技术涉及一种金融产品的联邦推荐方法

【技术实现步骤摘要】
金融产品的联邦推荐方法、装置、终端设备及介质


[0001]本专利技术适用于金融业务领域,尤其涉及一种金融产品的联邦推荐方法

装置

终端设备及介质


技术介绍

[0002]现有技术的金融产品推荐系统中,用户的数据通常指用户对金融产品的交互行为和个人信息,无论是数据实例的维度还是数据实例的数量,数据越多往往能够取得越好的效果

因此,部分推荐机构将一些具有相同用户群体的应用组成推荐数据联盟,进而共享彼此的用户数据,已经成为行业内常见的做法

与此同时随着公众对隐私安全需求的增加和数据隐私相关法律法规的颁布,对如何为用户提供精确推荐的同时又能保护数据隐私带来了新的挑战

[0003]为了解决以上问题,存在将联邦学习技术应用于金融产品推荐场景的方法,使得原始数据在不离开本地前提下仍能得到良好的个性化服务,但是联邦推荐算法存在以下问题:联邦学习参与方的数据异质性或数据量不同等情况,可能会造成模型质量下降,使物品的推荐准确度降低;并且,由于中心服务器和客户端的目标不同,中心服务器追求的是一般化模型,而客户端最求的是个性化模型,客户最终可能只能得到质量很差的物品推荐结果


技术实现思路

[0004]有鉴于此,本专利技术实施例提供了一种金融产品的联邦推荐方法

装置

终端设备及介质,以解决现有物品推荐方法的推荐准确率低,用户体验差的问题

[0005]第一方面,提供一种金融产品的联邦推荐方法,应用于
N
个客户端,
N≥2
,所述联邦推荐方法包括:
[0006]获取目标用户的用户特征,以及
M
个备选物品的物品特征,
M≥2
,对所述用户特征和物品特征进行处理,得到目标用户对备选物品的特征序列;
[0007]将所述目标用户对备选物品的特征序列输入至各个客户端中训练好的第一物品推荐模型中,得到目标用户对物品的推荐结果;
[0008]所述第一物品推荐模型的训练过程包括:
[0009]获取所述服务端发送的物品推荐模型参数,利用所述物品推荐模型参数更新预设的第二物品推荐模型;
[0010]获取用户对备选物品的样本特征序列,将所述样本特征序列分别输入至所述第二物品推荐模型和初始化的第一物品推荐模型中,将所述第二物品推荐模型作为教师模型

所述第一物品推荐模型作为学生模型,进行一次知识蒸馏训练,得到一次知识蒸馏训练后的第一物品推荐模型和第二物品推荐模型;
[0011]将所述知识蒸馏训练后的第二物品推荐模型的参数发送至所述服务端,供所述服务端中的联邦学习模型对各个客户端发送的第二物品推荐模型的参数进行处理,以输出更新的物品推荐模型参数;
[0012]重复上述步骤,再次从所述服务端获取所述更新的物品推荐模型参数,更新所述第二物品推荐模型,并进行下一次知识蒸馏训练;直至满足预设条件,输出训练好的第一物品推荐模型

[0013]第二方面,提供一种金融产品的联邦推荐装置,所述联邦推荐装置包括:
[0014]数据采集处理模块,用于获取目标用户的用户特征,以及
M
个备选物品的物品特征,
M≥2
,对所述用户特征和物品特征进行处理,得到目标用户对备选物品的特征序列;
[0015]物品推荐模块,设置有第一物品推荐模型,用于输入所述目标用户对备选物品的特征序列,输出目标用户对物品的推荐结果;其中,所述第一物品推荐模型的训练过程包括:
[0016]获取所述服务端发送的物品推荐模型参数,利用所述物品推荐模型参数更新预设的第二物品推荐模型;
[0017]获取用户对备选物品的样本特征序列,将所述样本特征序列分别输入至所述第二物品推荐模型和初始化的第一物品推荐模型中,将所述第二物品推荐模型作为教师模型

所述第一物品推荐模型作为学生模型,进行一次知识蒸馏训练,得到一次知识蒸馏训练后的第一物品推荐模型和第二物品推荐模型;
[0018]将所述知识蒸馏训练后的第二物品推荐模型的参数发送至所述服务端,供所述服务端中的联邦学习模型对各个客户端发送的第二物品推荐模型的参数进行处理,以输出更新的物品推荐模型参数;
[0019]重复上述步骤,再次从所述服务端获取所述更新的物品推荐模型参数,更新所述第二物品推荐模型,并进行下一次知识蒸馏训练;直至满足预设条件,输出训练好的第一物品推荐模型

[0020]第三方面,本专利技术实施例提供一种终端设备,所述终端设备包括处理器

存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的金融产品的联邦推荐方法

[0021]第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的金融产品的联邦推荐方法

[0022]第五方面,本专利技术实施例提供一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面所述的金融产品的联邦推荐方法

[0023]本专利技术与现有技术相比存在的有益效果是:
[0024]本专利技术通过将知识蒸馏技术和联邦学习技术相结合,训练得到了用于进行物品推荐的第一物品推荐模型;具体的,在客户端中的第一物品推荐模型和第二物品推荐模型之间进行一次知识蒸馏训练之后,随之对应在服务端和若干个客户端之间进行一次联邦学习训练,也就是知识蒸馏训练和联邦学习训练间隔执行,从而得到推荐准确率更高的第一物品推荐模型;并且,使得数据不需要离开本地客户端的情况下进行模型训练,保护了数据安全和用户数据隐私,同时针对每一个客户端做单独的第一物品推荐模型训练,解决各个客户端作为参与方的数据异质性问题

附图说明
[0025]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图

[0026]图1是本专利技术实施例一提供的一种金融产品的联邦推荐方法的一应用环境示意图;
[0027]图2是本专利技术实施例一提供的一种金融产品的联邦推荐方法的流程示意图;
[0028]图3是本专利技术实施例一提供的联邦推荐方法中第一

第二物品推荐模型的训练流程示意图;
[0029]图4是本专利技术实施例二提供的一种金融产品的联邦推荐方法的流程示意图;
[0030]图5是本专利技术实施例二提供的联邦推荐方法中第一

第二和第三物品推荐模型的训练流程示意图;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种金融产品的联邦推荐方法,其特征在于,所述联邦推荐方法应用于
N
个客户端,
N≥2
,所述联邦推荐方法包括以下步骤:获取目标用户的用户特征,以及
M
个备选物品的物品特征,
M≥2
,对所述用户特征和物品特征进行处理,得到目标用户对备选物品的特征序列;将所述目标用户对备选物品的特征序列输入至各个客户端中训练好的第一物品推荐模型中,得到目标用户对物品的推荐结果;所述第一物品推荐模型的训练过程包括:获取服务端发送的物品推荐模型参数,利用所述物品推荐模型参数更新预设的第二物品推荐模型;获取用户对备选物品的样本特征序列,将所述样本特征序列分别输入至所述第二物品推荐模型和初始化的第一物品推荐模型中,将所述第二物品推荐模型作为教师模型

所述第一物品推荐模型作为学生模型,进行一次知识蒸馏训练,得到一次知识蒸馏训练后的第一物品推荐模型和第二物品推荐模型;将所述知识蒸馏训练后的第二物品推荐模型的参数发送至所述服务端,供所述服务端中的联邦学习模型对各个客户端发送的第二物品推荐模型的参数进行处理,以输出更新的物品推荐模型参数;重复上述步骤,再次从所述服务端获取所述更新的物品推荐模型参数,更新所述第二物品推荐模型,并进行下一次知识蒸馏训练;直至满足预设条件,输出训练好的第一物品推荐模型
。2.
根据权利要求1所述的金融产品的联邦推荐方法,其特征在于,供所述服务端中的联邦学习模型对各个客户端发送的第二物品推荐模型的参数进行处理,以输出更新的物品推荐模型参数包括:获取各个客户端发送的第二物品推荐模型的参数,对所有客户端发送的第二物品推荐模型的参数进行聚合后再求平均值,得到更新的物品推荐模型参数,输出所述更新的物品推荐模型参数
。3.
根据权利要求1所述的金融产品的联邦推荐方法,其特征在于,将所述第二物品推荐模型作为教师模型

所述第一物品推荐模型作为学生模型,进行一次知识蒸馏训练,得到一次知识蒸馏训练后的第一物品推荐模型和第二物品推荐模型包括:利用所述第一物品推荐模型

所述第二物品推荐模型和所述样本特征序列,得到用户对物品的第一样本推荐结果预测值

第二样本推荐结果预测值,以及标签预测值;利用所述第一样本推荐结果预测值和所述样本特征序列的真实标签值,计算得到第一损失;利用所述第二样本推荐结果预测值和所述标签预测值,计算第二损失;利用所述第一样本推荐结果预测值

第二样本推荐结果预测值和所述真实标签值,计算用于表征所述第二样本推荐结果预测值相对于所述第一样本推荐结果预测值之间差异性的第一
KL
散度,用于表征所述第一样本推荐结果预测值相对于所述第二样本推荐结果预测值之间差异性的第二
KL
散度;利用所述第一损失和所述第一
KL
散度计算所述第一物品推荐模型的损失,利用所述第二损失和所述第二
KL
散度计算所述第二物品推荐模型的损失,用于进行所述知识蒸馏训
练,得到一次知识蒸馏训练后的第一物品推荐模型和第二物品推荐模型
。4.
根据权利要求1所述的金融产品的联邦推荐方法,其特征在于,所述联邦推荐方法还包括以下步骤:将所述目标用户对备选物品的特征序列输入至各个客户端中训练好的第三物品推荐模型中,得到目标用户对物品的备用推荐结果;所述第一物品推荐模型和第三物品推荐模型的训练过程包括:获取所述服务端发送的物品推荐模型参数,利用所述物品推荐模型参数更新预设的第二物品推荐模型;获取用户对备选物品的样本特征序列,将所述样本特征序列分别输入至所述第二物品推荐模型和初始化的第一物品推荐模型中,将所述第二物品推荐模型作为教师模型,将所述第一物品推荐模型和所述第三物品推荐模型作为学生模型,进行一次知识蒸馏训练,得到一次知识蒸馏训练后的第一物品推荐模型

第二物品推荐模型和第三物品推荐模型;将所述知识蒸馏训练后的第二物品推荐模型的参数发送至所述服务端,供所述服务端中的联邦学习模型对各个客户端发送的第二物品推荐模型的参数进行处理,以输出更新的物品推荐模型参数;重复上述步骤,再次从所述服务端获取所述更新的物品推荐模型参数,更新所述第二物品推荐模型,并进行下一次知识蒸馏训练;直至满足预设条件,输出训练好的第一物品推荐模型和第三物品推荐模型
。5.
根据权利要求4所述的金融产品的联邦推荐方法,其特征在于,将所述第二物品推荐模型作为教师模型,将所述第一物品推荐模型和所述第三物品推荐...

【专利技术属性】
技术研发人员:岑志彬
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1