基于隐私保护的跨域推荐模型训练方法及训练系统技术方案

技术编号:29836077 阅读:29 留言:0更新日期:2021-08-27 14:25
本申请提供一种基于隐私保护的跨域推荐模型训练方法及训练系统,其中基于隐私保护的跨域推荐模型训练方法包括:数据域单元获取到用户信息和项目信息后,提取用户信息的特征向量和项目信息的特征向量,然后对提取的用户信息的特征向量、项目信息的特征向量分别进行数据加密,再基于加密后的特征向量进行向量融合处理,得到融合向量,数据域单元基于融合向量训练跨域推荐模型。本申请实施例的特征向量经过了数据加密,其他用户无法轻易获得原始的用户信息和项目信息,在训练跨域推荐模型的过程中,保证了用户信息和项目信息的隐私性,同时使得训练得到的跨域推荐模型可以适配跨域推荐的任务。

【技术实现步骤摘要】
基于隐私保护的跨域推荐模型训练方法及训练系统
本申请涉及数据处理
,特别涉及基于隐私保护的跨域推荐模型训练方法及训练系统。本申请同时涉及跨域推荐方法及装置、计算设备和计算机可读存储介质。
技术介绍
随着互联网的飞速发展,互联网中的数据信息呈现爆发式增长,面对海量的数据信息,用户很难从众多选择中挑选出自己感兴趣的项目。为了改善用户的体验,推荐系统被广泛应用于不同的场景,如在线购物、音乐推荐、电影推荐等。在现实场景中,很多用户会在不同的数据与平台上享受网络服务,例如在订票网站点评电影、在购书网站点评书籍、在购物网站购买商品等。跨域推荐的任务,一般是指在两个数据域中用户的构成有重叠,这样,不同的数据域之间就有了一定量的用户数据。但是总体来说,用户数据在每一个数据域上并不一定都很充足。可能有的数据域的用户数据比较稠密,但有的数据域的用户数据非常稀疏,那么如何克服数据域之间的不平衡性,使得不同数据域上的用户数据可以相互利用、相互补充,成为跨域推荐中的重要任务。目前的跨域推荐一般是利用跨域推荐模型实现的,目标域可以获得源域的用户数据,本文档来自技高网...

【技术保护点】
1.一种基于隐私保护的跨域推荐模型训练方法,其特征在于,应用于训练系统,所述训练系统包括计算单元和多个数据域单元,所述训练方法包括:/n各数据域单元获取相应数据域生成的用户信息、项目信息以及用户与项目的标注关联信息,提取所述用户信息的第一特征向量及所述项目信息的第二特征向量,对所述第一特征向量、所述第二特征向量分别进行数据加密,得到第一加密特征向量和第二加密特征向量,并将所述第一加密特征向量和所述第二加密特征向量发送至所述计算单元;/n所述计算单元对所述各数据域单元发送的所述第一加密特征向量、所述第二加密特征向量进行向量融合处理,得到融合向量,并将所述融合向量反馈至所述各数据域单元;/n所述各...

【技术特征摘要】
1.一种基于隐私保护的跨域推荐模型训练方法,其特征在于,应用于训练系统,所述训练系统包括计算单元和多个数据域单元,所述训练方法包括:
各数据域单元获取相应数据域生成的用户信息、项目信息以及用户与项目的标注关联信息,提取所述用户信息的第一特征向量及所述项目信息的第二特征向量,对所述第一特征向量、所述第二特征向量分别进行数据加密,得到第一加密特征向量和第二加密特征向量,并将所述第一加密特征向量和所述第二加密特征向量发送至所述计算单元;
所述计算单元对所述各数据域单元发送的所述第一加密特征向量、所述第二加密特征向量进行向量融合处理,得到融合向量,并将所述融合向量反馈至所述各数据域单元;
所述各数据域单元基于所述融合向量及所述标注关联信息,训练跨域推荐模型。


2.根据权利要求1所述的跨域推荐模型训练方法,其特征在于,所述各数据域单元提取所述用户信息的第一特征向量及所述项目信息的第二特征向量的步骤,包括:
所述各数据域单元将所述用户信息、所述项目信息分别输入预设神经网络,经所述预设神经网络的隐层,提取出所述用户信息的第一特征向量、所述项目信息的第二特征向量。


3.根据权利要求1所述的跨域推荐模型训练方法,其特征在于,所述各数据域单元对所述第一特征向量、所述第二特征向量分别进行数据加密,得到第一加密特征向量和第二加密特征向量的步骤,包括:
所述各数据域单元分别在所述第一特征向量、所述第二特征向量中加入服从差分隐私的噪声数据,得到第一加密特征向量和第二加密特征向量。


4.根据权利要求1-3任一项所述的跨域推荐模型训练方法,其特征在于,各数据域生成的用户信息有重合,所述各数据域生成的项目信息不同;
所述计算单元对所述各数据域单元发送的所述第一加密特征向量、所述第二加密特征向量进行向量融合处理,得到融合向量的步骤,包括:
所述计算单元利用预设的融合函数,对所述各数据域单元发送的所述第一加密特征向量中重合的用户信息的第一加密特征向量进行融合计算,得到融合向量,其中,所述融合向量包括重合的用户信息的第一加密特征向量的融合计算结果、非重合的用户信息的第一加密特征向量和所述第二加密特征向量。


5.根据权利要求1-3任一项所述的跨域推荐模型训练方法,其特征在于,各数据域生成的用户信息有重合,所述各数据域生成的项目信息有重合;
所述计算单元对所述各数据域单元发送的所述第一加密特征向量、所述第二加密特征向量进行向量融合处理,得到融合向量的步骤,包括:
所述计算单元利用预设的融合函数,对所述各数据域单元发送的所述第一加密特征向量中重合的用户信息的第一加密特征向量、重合的项目信息的第二加密特征向量分别进行融合计算,得到融合向量,其中,所述融合向量包括重合的用户信息的第一加密特征向量的融合计算结果、重合的项目信息的第二加密特征向量的融合计算结果、非重合的用户信息的第一加密特征向量和非重合的项目信息的第二加密特征向量。


6.一种基于隐私保护的跨域推荐模型训练方法,其特征在于,应用于训练系统,所述训练系统包括源域单元和目标域单元,所述训练方法包括:
所述源域单元获取源域生成的源域用户信息、源域项目信息以及源域用户与源域项目的第一标注关联信息,提取所述源域用户信息的第三特征向量及所述源域项目信息的第四特征向量,对所述第三特征向量、所述第四特征向量分别进行数据加密,得到第三加密特征向量和第四加密特征向量,并将所述第三加密特征向量、所述第四加密特征向量及所述第一标注关联信息发送至所述目标域单元;
所述目标域单元获取目标域生成的目标域用户信息、目标域项目信息以及目标域用户与目标域项目的第二标注关联信息,提取所述目标域用户信息的第五特征向量及所述目标域项目信息的第六特征向量,基于所述源域单元发送的所述第三加密特征向量、所述第四加密特征向量、所述第五特征向量、所述第六特征向量,进行向量融合处理,得到融合向量,并基于所述融合向量及所述第一标注关联信息、所述第二标注关联信息,训练跨域推荐模型。


7.根据权利要求6所述的跨域推荐模型训练方法,其特征在于,所述源域单元提取所述源域用户信息的第三特征向量及所述源域项目信息的第四特征向量的步骤,包括:
所述源域单元将所述源域用户信息、所述源域项目信息分别输入预设神经网络,经所述预设神经网络的隐层,提取出所述源域用户信息的第三特征向量、所述源域项目信息的第四特征向量。


8.根据权利要求6所述的跨域推荐模型训练方法,其特征在于,所述源域单元对所述第三特征向量、所述第四特征向量分别进行数据加密,得到第三加密特征向量和第四加密特征向量的步骤,包括:
所述源域单元分别在所述第三特征向量、所述第四特征向量中加入服从差分隐私的噪声数据,得到第三加密特征向量和第四加密特征向量。


9.根据权利要求6所述的跨域推荐模型训练方法,其特征...

【专利技术属性】
技术研发人员:郑小林刘伟明
申请(专利权)人:杭州金智塔科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1