基于联邦学习的产品信息推荐方法、装置、设备及介质制造方法及图纸

技术编号:36705549 阅读:20 留言:0更新日期:2023-03-01 09:27
本公开提供了一种基于联邦学习的产品信息推荐方法、装置、涉及存储介质,涉及数据处理技术领域。具体包括:通过第一参与方的用户/产品交互数据和第二参与方的用户/用户社交数据,以及已训练的产品嵌入矩阵和已训练的用户嵌入矩阵,通过联邦学习协同过滤的方式,对第一参与方中用户的产品偏好信息进行预测,得到预测结果矩阵,用于为第一参与方中的用户更精准的推荐用户偏好的产品信息。通过上述方式,可以在保护数据安全及隐私的前提下,利用用户/用户社交数据,精准的为用户推荐用户感兴趣的产品信息。趣的产品信息。趣的产品信息。

【技术实现步骤摘要】
基于联邦学习的产品信息推荐方法、装置、设备及介质


[0001]本公开涉及数据处理
,尤其涉及基于联邦学习的产品信息推荐方法、装置、设备及介质。

技术介绍

[0002]随着互联网技术的发展,信息从匮乏步入过载,在这种时代背景下,信息越来越难展示给真正对它感兴趣的用户,普通用户也很难从大量的信息中找到自身感兴趣的内容,一般通过对海量信息进行分析,并以推荐的方式向用户展示其可能感兴趣的信息,连接用户和信息,创造价值。
[0003]在数据安全及隐私保护等限制下,如何通过合规的手段,从海量信息中将用户感兴趣的产品信息精准的推荐给用户是一个亟待解决的问题。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开提供基于联邦学习的产品信息推荐方法、装置、设备及介质,至少可以在数据安全及隐私保护等限制下,将用户感兴趣的产品信息精准的推荐给用户。
[0006]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0007]第一方面,本公开中的实施例提供一种基于联邦学习的产品信息推荐方法,所述方法包括:
[0008]根据第一参与方的用户/产品交互数据,获取联邦学习中第一参与方的用户/产品交互矩阵,以及获取所述第一参与方对应的产品嵌入矩阵,所述产品嵌入矩阵是预先通过联邦学习训练得到的;
[0009]根据所述产品嵌入矩阵和用户/产品交互矩阵,确定所述第一参与方的用户产品偏好矩阵;
[0010]向第二参与方发起联邦学习协同请求,接收所述第二参与方根据所述联邦学习协同请求返回的用户社交偏好矩阵;其中,所述用户社交偏好矩阵为所述第二参与方根据所述第二参与方的用户/用户社交矩阵和所述第二参与方对应的用户嵌入矩阵确定的;所述第二参与方对应的用户嵌入矩阵是预先通过联邦学习训练得到的;所述用户/用户社交矩阵为根据所述第二参与方的用户/用户社交数据得到的;
[0011]基于所述用户产品偏好矩阵、所述用户社交偏好矩阵和所述产品嵌入矩阵,对所述第一参与方中用户的产品偏好信息进行预测,得到预测结果矩阵,以基于所述产品偏好信息推荐产品信息;其中,所述产品偏好信息为预测用户对产品存在偏好的信息。
[0012]在本公开的一个实施例中,所述方法还包括:
[0013]通过所述第一参与方的用户/产品交互训练数据和所述第二参与方的用户/用户
社交训练数据,对初始产品嵌入矩阵和初始用户嵌入矩阵进行联邦学习训练,得到训练预测结果差值;其中,所述初始产品嵌入矩阵为未进行联邦学习训练的产品嵌入矩阵;所述初始用户嵌入矩阵为未进行联邦学习训练的产品嵌入矩阵;
[0014]基于所述训练预测结果差值,对所述初始产品嵌入矩阵梯度更新,调整联邦学习训练过程中的参数,直至联邦协同训练损失值满足第一预设值,得到已训练的产品嵌入矩阵;
[0015]向所述第二参与方发送梯度更新信息,以使所述第二参与方根据所述梯度更新信息中的梯度更新矩阵,对所述初始用户嵌入矩阵进行梯度更新,得到已训练的用户嵌入矩阵;所述梯度更新信息为根据所述训练预测结果差值和所述产品嵌入矩阵确定的。
[0016]在本公开的一个实施例中,所述通过所述第一参与方的用户/产品交互训练数据和所述第二参与方的用户/用户社交训练数据,对初始产品嵌入矩阵和初始用户嵌入矩阵进行联邦学习训练,得到训练预测结果差值,包括:
[0017]根据第一参与方的用户/产品交互训练数据,确定所述第一参与方的用户/产品交互训练矩阵;
[0018]基于所述用户/产品交互训练矩阵,随机生成初始产品嵌入矩阵;
[0019]向所述第二参与方发起联邦学习训练请求,使得所述第二参与方根据所述用户/用户社交训练数据,建立用户/用户社交训练矩阵,以及基于所述用户/用户社交训练矩阵,随机生成初始用户嵌入矩阵;
[0020]从所述第一参与方中抽取用户样本,基于用户/产品交互训练矩阵索引所述用户样本,得到所述用户样本对应的用户/产品交互训练矩阵样本;
[0021]将所述用户样本同步至所述第二参与方,使得所述第二参与方构建所述用户样本对应的用户/用户社交训练矩阵样本,以及索引所述用户样本对应的用户嵌入矩阵样本;
[0022]根据所述用户/产品交互训练矩阵样本和初始产品嵌入矩阵,确定用户产品偏好训练矩阵;
[0023]获取基于所述联邦学习训练请求,所述第二参与方返回的用户社交偏好训练矩阵;其中,用户社交偏好训练矩阵为根据所述用户/用户社交训练矩阵样本和所述用户嵌入矩阵样本确定的;
[0024]基于所述用户产品偏好训练矩阵和所述用户社交偏好训练矩阵,得到训练预测结果;
[0025]根据所述用户/产品交互训练矩阵样本,生成用户/产品交互训练正负样本矩阵;其中,所述用户/产品交互训练正负样本矩阵为将所述用户/产品交互训练矩阵样本中所述用户样本与产品之间的随机部分值由0置为1得到的;
[0026]根据所述训练预测结果、所述用户/产品交互训练正负样本矩阵和所述用户/产品交互训练矩阵样本,确定训练预测结果差值。
[0027]在本公开的一个实施例中,所述向所述第二参与方发送梯度更新信息,以使所述第二参与方根据所述梯度更新信息中的梯度更新矩阵,对所述初始用户嵌入矩阵进行梯度更新,得到已训练的用户嵌入矩阵,包括:
[0028]向所述第二参与方发送梯度更新信息,以使所述第二参与方根据所述梯度更新矩阵,确定用户更新梯度值;其中,所述用户更新梯度值为根据所述用户/用户社交训练数据
抽取的训练样本对应的初始用户嵌入矩阵样本的更新梯度值;
[0029]根据所述更新梯度值和用户/用户社交训练矩阵样本,对初始用户嵌入矩阵进行梯度更新,得到已训练的用户嵌入矩阵;所述用户/用户社交训练矩阵样本为根据所述用户/用户社交训练数据抽取的训练样本对应的矩阵。
[0030]在本公开的一个实施例中,所述第一参与方的用户产品偏好矩阵如下:
[0031][0032]其中,P
i
表示用户产品偏好矩阵;R表示用户/产品交互矩阵;Q表示产品嵌入矩阵。
[0033]在本公开的一个实施例中,所述第二参与方的用户社交偏好矩阵如下:
[0034][0035]其中,P
s
表示用户社交偏好矩阵;S表示用户/用户社交矩阵;P表示用户嵌入矩阵。
[0036]在本公开的一个实施例中,所述基于所述用户产品偏好矩阵、所述用户社交偏好矩阵和所述产品嵌入矩阵,对所述第一参与方中用户的产品偏好信息进行预测,得到预测结果矩阵,包括:
[0037]通过安全矩阵乘算法,将所述用户社交偏好矩阵与所述产品嵌入矩阵的转置相乘,得到安全矩阵乘结果;
[0038]根据所述用户产品偏好矩阵、所述产品嵌入矩阵的转置以及所述安全矩阵乘结果,确定本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的产品信息推荐方法,其特征在于,所述方法包括:根据第一参与方的用户/产品交互数据,获取联邦学习中第一参与方的用户/产品交互矩阵,以及获取所述第一参与方对应的产品嵌入矩阵;所述产品嵌入矩阵是预先通过联邦学习训练得到的;根据所述产品嵌入矩阵和用户/产品交互矩阵,确定所述第一参与方的用户产品偏好矩阵;向第二参与方发起联邦学习协同请求,接收所述第二参与方根据所述联邦学习协同请求返回的用户社交偏好矩阵;其中,所述用户社交偏好矩阵为所述第二参与方根据所述第二参与方的用户/用户社交矩阵和所述第二参与方对应的用户嵌入矩阵确定的;所述第二参与方对应的用户嵌入矩阵是预先通过联邦学习训练得到的;所述用户/用户社交矩阵为根据所述第二参与方的用户/用户社交数据得到的;基于所述用户产品偏好矩阵、所述用户社交偏好矩阵和所述产品嵌入矩阵,对所述第一参与方中用户的产品偏好信息进行预测,得到预测结果矩阵,以基于所述产品偏好信息推荐产品信息;其中,所述产品偏好信息为预测用户对产品存在偏好的信息。2.根据权利要求1所述的产品信息推荐方法,其特征在于,所述方法还包括:通过所述第一参与方的用户/产品交互训练数据和所述第二参与方的用户/用户社交训练数据,对初始产品嵌入矩阵和初始用户嵌入矩阵进行联邦学习训练,得到训练预测结果差值;其中,所述初始产品嵌入矩阵为未进行联邦学习训练的产品嵌入矩阵;所述初始用户嵌入矩阵为未进行联邦学习训练的产品嵌入矩阵;基于所述训练预测结果差值,对所述初始产品嵌入矩阵梯度更新,并调整联邦学习训练过程中的参数,直至联邦协同训练损失值满足第一预设值,得到已训练的产品嵌入矩阵;向所述第二参与方发送梯度更新信息,以使所述第二参与方根据所述梯度更新信息中的梯度更新矩阵,对所述初始用户嵌入矩阵进行梯度更新,得到已训练的用户嵌入矩阵;所述梯度更新信息为根据所述训练预测结果差值和所述产品嵌入矩阵确定的。3.根据权利要求2所述的产品信息推荐方法,其特征在于,所述通过所述第一参与方的用户/产品交互训练数据和所述第二参与方的用户/用户社交训练数据,对初始产品嵌入矩阵和初始用户嵌入矩阵进行联邦学习训练,得到训练预测结果差值,包括:根据第一参与方的用户/产品交互训练数据,确定所述第一参与方的用户/产品交互训练矩阵;基于所述用户/产品交互训练矩阵,随机生成初始产品嵌入矩阵;向所述第二参与方发起联邦学习训练请求,使得所述第二参与方根据所述用户/用户社交训练数据,建立用户/用户社交训练矩阵,以及基于所述用户/用户社交训练矩阵,随机生成初始用户嵌入矩阵;从所述第一参与方中抽取用户样本,基于用户/产品交互训练矩阵索引所述用户样本,得到所述用户样本对应的用户/产品交互训练矩阵样本;将所述用户样本同步至所述第二参与方,使得所述第二参与方构建所述用户样本对应的用户/用户社交训练矩阵样本,以及索引所述用户样本对应的用户嵌入矩阵样本;根据所述用户/产品交互训练矩阵样本和初始产品嵌入矩阵,确定用户产品偏好训练
矩阵;获取基于所述联邦学习训练请求,所述第二参与方返回的用户社交偏好训练矩阵;其中,用户社交偏好训练矩阵为根据所述用户/用户社交训练矩阵样本和所述用户嵌入矩阵样本确定的;基于所述用户产品偏好训练矩阵和所述用户社交偏好训练矩阵,得到训练预测结果;根据所述用户/产品交互训练矩阵样本,生成用户/产品交互训练正负样本矩阵;其中,所述用户/产品交互训练正负样本矩阵为将所述用户/产品交互训练矩阵样本中所述用户样本与产品之间的随机部分值由0置为1得到的;根据所述训练预测结果、所述用户/产品交互训练正负样本矩阵和所述用户/产品交互训练矩阵样本,确定所述训练预测结果差值。4.根据权利要求2所述的产品信息推荐方法,其特征在于,所述向所述第二参与方发送梯...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:杭州博盾习言科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1