基于联邦学习和隐私保护的跨域推荐方法技术

技术编号:38055522 阅读:11 留言:0更新日期:2023-06-30 11:21
本发明专利技术涉及一种基于联邦学习和隐私保护的跨域推荐方法,属于跨域推荐技术领域。该方法包括:S1:将不同领域的共同用户进行对齐:分别根据相似度阈值在源域和目标域寻找冷启动用户的相似用户;S2:根据元路径及随机游走策略构建异构信息网络,并将相似用户输入异构信息网络中,提取冷启动用户源域潜在特征,并利用该特征得到用户

【技术实现步骤摘要】
基于联邦学习和隐私保护的跨域推荐方法


[0001]本专利技术属于个跨域推荐
,涉及一种基于联邦学习和隐私保护的跨域推荐方法。

技术介绍

[0002]随着经济科技的不断发展,线上购物功能的不断完善,消费群体的购物行为逐渐从实体店铺转到了线上网购平台,同时近年来短视频的迅猛发展,主播带货也成为了一种较为流行的消费方式。逐渐的,互联网各大平台都积累了大量的用户消费行为和兴趣偏好数据。据此,很多研究人员都尝试研究一些模型系统来分析用户在网络上的一些行为,以此来提升用户的冲浪体验,促进用户的消费行为以及平台收益,同时也缩进了用户与商家之间的距离。例如,根据用户的购物习惯,为用户推荐可能喜欢的店铺,从而提升用户的购物体验。
[0003]随着近年来用户隐私保护观念的提升,很多用户不愿意将自己的历史数据分享给平台,这使得推荐系统的发展受到了限制,由于推荐系统原理就是利用用户的历史行为来预测用户偏好并将其呈现给用户,因此开发具有隐私保护的推荐系统是很有必要的。进一步的,根据当前大数据的特点来看,用户的数据呈现了整体量大局部稀疏的特点,也就是局部会出现“数据孤岛”问题。这就使得推荐系统容易出现冷启动问题和数据稀疏性问题,影响推荐准确性。跨域推荐系统的出现完美的解决了这个问题,跨域推荐可以结合多个领域的数据,引入其它领域(源领域)的信息来进行辅助,使得在目标领域甚至多个领域上都能进行更好的推荐。
[0004]个性化推荐系统在解决数据稀疏性问题和冷启动问题时常用方法一般为考虑数据间交互的潜在特征。如:文献[1]提出了一种基于深度学习旅游的个人信息推荐平台的系统方法。该方法基于深度学习旅游的个人信息推荐平台系统使游客能够通过科学的信息组织和呈现形式方便、快速地获取旅游信息,并帮助游客更好地安排旅游计划和形成旅游决策。通过有效聚合多个节点邻域,将高阶协作信息嵌入到节点嵌入向量中,获得用户的潜在偏好,解决用户数据稀疏和冷启动问题。文献[2]设计了一种基于多K近邻回归算法的英语教学资源个性化推荐系统。根据教学资源个性化推荐系统的总体架构,设计了资源浏览功能模块、教学资源详细页面推荐模块和教学资源数据库。基于多K近邻回归算法的基本思想,为了避免英语教学资源推荐中重要数据的丢失,降低数据丢失率,提出了一种英语教学资源缺失数据重建算法。最后,从浏览路径和访问时间的选择上考虑学生用户的路径兴趣,实现英语教学资源的个性化推荐。
[0005]目前,跨域推荐还未被广泛应用。大部分研究主要集中在社交网络数据及用户与项目间交互关系上。如:文献[3]提出了基于边缘剪枝的跨域推荐(CDR)的细化图表示,该图表示考虑了潜在空间中的特征分布。该方法将边缘修剪引入到最新的基于图的CDR中改进图形中来。比较在不同域,构建一个潜在空间,并通过它们的相关性进行边缘修剪。之后获得了跨域特定的图表示,通过边缘修剪,考虑两个项目之间的关系来提高性能。文献[4]提
出了一种新的基于图协同过滤(CsrGCF)的跨域顺序重新评价方法,以缓解用户交互数据的稀疏性问题。具体地,通过设计具有协同过滤的时间感知和关系感知图注意机制,以利用用户的高阶行为模式,在两个领域都取得了令人满意的结果。时间感知图注意机制(TGAT)旨在学习项目的域内序列级表示。提出了关系感知图注意机制(RGAT)来学习协作项和用户的特征表示。此外,为了同时提高两个域中的推荐性能,提出了一种跨域特征双向传递模型(CFBT),在两个域之间传递用户的公共共享特征,并在特定域中保留用户的域特定特征。最后,跨域和顺序信息共同推荐用户喜欢的下一个项目。但是,上述方法不具有隐私保护功能。
[0006]传统的个性化推荐系统隐私保护方法包括文献[5]‑
[7]、差分隐私[8]和加密[9]。Wang etal.[5]通过学习用户组偏好而不是个人偏好来保护用户隐私。他们的建议是通过基于非负矩阵分解技术的用户本地设备上的个性化组来提出的。Li et al.[8]使用马尔科夫链对用户的签到序列进行建模,并通过添加加权噪声来保护用户的隐私。Wang等人[9]设计了一种PLSA加密算法,并证明在半诚实协议下是安全的。但是,上述方法不具备跨域推荐功能。
[0007]目前在具有隐私保护的跨域推荐系统研究工作非常有限。如:文献[10]公开了一种新的基于群组推荐的隐私保护算法。通过用户建模、推荐对象建模和推荐算法分析推荐系统的通用模型,通过问卷分析感知推荐系统的隐私问题。基于用户隐私关注点分类,引入群组推荐,通过众包网提供的发件人匿名特性匿名提交用户数据,防止服务器和恶意用户识别好用户,完成对用户数据的研究。文献[11]公开了一种基于局部差分隐私保护方案的动态隐私预算分配方法,该方法中提出了一种改进的基于用户的协同过滤算法,该算法在计算用户相似度时采用了基于矩阵的相似度计算方法。在推荐过程中保护用户的隐私,同时保证推荐性能不会受到太大的损失。本专利技术提出的方案首先对本地敏感数据动态添加噪声,以保证用户的隐私,然后将添加噪声的数据发送到服务器进行相似度计算,最后通过基于用户的协同过滤算法给出电影推荐。文献[12]公开了一种基于差分隐私保护和时间因子的高效隐私保护协同过滤算法。这种方法可以有效地降低泄漏私人数据的风险,同时获得所需的隐私保护服务。然而,上述跨域推荐系统均未考虑电子商务与POI领域之间的相关性,无法实现准确的跨域推荐。
[0008]参考文献:
[0009][1]Xuejuan Wang:Implementation of Personalized Information Recommendation Platform System Based on Deep Learning Tourism.J.Sensors 2022:1

9(2022).
[0010][2]Yan Tang,Yang Yu:APersonalized Recommendation System for English Teaching Resources Based on Multi

K Nearest Neighbor Regression Algorithm.Secur.Commun.Networks 2022:7077123:1

7077123:11(2022).
[0011][3]Taisei Hirakawa,Keisuke Maeda,Takahiro Ogawa,Satoshi Asamizu,Miki Haseyama:Refining Graph Representation for Cross

Domain Recommendation Based on Edge Pruning in Latent Space.IEEE Access 10:12503

12509(2022).
[0012][4]Bingyuan Wang,Baisong Liu,Hao Ren,Xueyuan Zhang,Jiang本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习和隐私保护的跨域推荐方法,其特征在于,该方法具体包括以下步骤:S1:将不同领域的共同用户进行对齐:分别根据相似度阈值在源域和目标域寻找冷启动用户的相似用户;S2:根据元路径及随机游走策略构建异构信息网络,并将相似用户输入异构信息网络中,提取冷启动用户源域潜在特征,并利用该特征得到用户

项目交互特征矩阵;S3:在本地构建并训练联邦学习模型,具体是:采用卷积神经网络来识别用户

项目交互特征矩阵,然后采用联邦学习结合同态加密对中间结果进行加密与交换,并采用梯度下降算法对加密的目标进行优化;最后更新模型的梯度与损失函数;S4:利用训练好本地联邦学习模型为用户生成推荐结果。2.根据权利要求2所述的跨域推荐方法,其特征在于,步骤S1中,使用余弦相似度来衡量不同用户之间的相似度。3.根据权利要求1所述的跨域推荐方法,其特征在于,步骤S2中,构建异构信息网络具体包括:设置完元路径后,利用HIN2Vec方法对冷启动用户特征进行提取,HIN2Vec是一个神经网络模型,通过HIN2Vec能得到每个节点的向量表示;之后给路径中的每个节点v随机生成一个n维特征向量用于表示v构成的特征集W∈R
|V|
×
n
,并判断v1、v2与d的关系,v1和v2是路径d上的两个相邻的节点,r(r∈R)表示节点v1和v2之间的关系;然后根据HIN2Vec中的元路径判别公式进行判断,其中F(v1,v2,r)表示v1和v2是否存在关系r,若存在则值为1,不存在值为0;定义学习元路径中节点特征的目标函数为:L(v1,v2,r)=F(v1,v2,r)log[p(r|(v1,v2)]+(1

F(v1,v2,r))log(1

p(r|(v1,v2))
ꢀꢀ
(1)其中,L(v1,v2,r)为目标损失函数;F(v1,v2,r)表示v1和v2之间是否存在关系r,若存在值为1,不存在值为0;p(r|v1,v2)表示v1和v2具有关系r的概率;之后采用随机梯度下降算法对目标函数L(v1,v2,r)进行优化,根据HIN2Vec公式更新节点特征;在得到节点集的特征表示后,用户

项目交互特征矩T
u,i
表示如下:其中,T
u,i
∈W
|v|
×
n
,表示矩阵乘法,表示用户特征权重,表示项目特征权重,.t表示转置,表示第i个项目的第m条元路径的特征值,m表示一个元路径集合中的第m条条元路径,M表示所有的元路径集合。4.根据权利要求1所述的跨域推荐方法,其特征在于,步骤S3中,构建并训练联邦学习模型,具体包括:设定纵向联邦学习的目标函数L为:其中,表示的是A领域的特征参数,表示的是B领域的特征参数,θ
A
是A领域的模型参数,θ
B
是B领域的模型参数,y
i
是标签,λ是正则化参数;假设用[[
·
]]表示同态加密操作,则加密的目标函数表示为:
其中,L
A
表...

【专利技术属性】
技术研发人员:苏畅李佳庆谢显中
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1