一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法技术

技术编号:33543213 阅读:41 留言:0更新日期:2022-05-21 09:56
本发明专利技术提出了一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法,获得用户个人信息和用户交互序列数据集,将数据集进行预处理并分为训练集和测试集;构建基于图神经网络挖掘用户长短期兴趣的序列推荐模型;对所述基于图神经网络挖掘用户长短期兴趣的序列推荐模型进行训练;将待推荐用户的个人信息和交互序列输入到训练后的基于图神经网络挖掘用户长短期兴趣的序列推荐模型,计算待推荐项目相对于该用户的推荐得分,根据推荐得分将项目推荐给用户;本发明专利技术解决序列推荐场景中没有办法有效捕获用户长短期兴趣,并难以分辨噪声的问题。题。题。

【技术实现步骤摘要】
一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法


[0001]本专利技术属于序列推荐
,具体地,涉及一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法。

技术介绍

[0002]随着互联网服务和移动设备使用的不断增长,互联网用户可以轻松访问大量在线产品和服务。尽管这种增长为用户提供了更多可用的选择,但用户也很难从大量候选商品中挑选出最喜欢的商品。为了减少信息过载,满足用户多样化的需求,个性化推荐系统应运而生,并在现代社会中发挥着越来越重要的作用。这些系统可以提供个性化的体验,服务用户的个人需求,具体好处有:(1)帮助用户轻松发现自己感兴趣的产品;(2)为产品提供商创造增加收入的机会。
[0003]在各种互联网服务中,用户按时间顺序访问项目,其中用户将交互的项目与他刚刚访问的那些项目密切相关。此属性有助于完成一项重要的推荐任务——序列推荐,它将用户行为历史视为按交互时间戳排序的交互序列。
[0004]关于序列推荐的最早工作是使用马尔可夫链(Markov chains MCs)来模拟项目之间的一阶转移关系,或者使用马尔可夫决策过程(Markov decision processes,MDP)来处理长期影响。后来,因子化的个性化MCs被提出并扩展到更高阶的版本,其灵感来自并结合了基于通用矩阵分解(matrix factorization,MF)的方法。例如,FPMC(Factorizing Personalized Markov Chains)分解个性化马尔可夫链,以便捕捉长期兴趣和短期偏好。Fossil结合了基于相似性的模型和高阶马尔可夫链。TransRec(Translation

based Recommendation)提出了一种基于转化的序列推荐方法。最近,受序列学习在自然语言处理中的优势的启发,研究人员提出了基于(深度)神经网络的方法来学习序列。例如,Caser(Convolutional Sequence Embedding Recommendation)应用卷积神经网络来处理项目嵌入序列。基于递归神经网络(Recurrent Neural Network,RNN)的方法,特别是基于门控递归单元(Gate Recurrent Unit,GRU)的方法已经被用于基于序列的推荐任务。自注意力机制在序列学习中有着良好的表现,并开始用于序列推荐。SASRec(Self

Attentive Sequential Recommendation)利用自我关注来自适应地考虑项目之间的相互作用。
[0005]目前基于深度学习的序列推荐方法中存在的问题:(1)用户行为在其丰富的历史序列中往往是隐含的和有噪声的偏好信号,它们不能充分反映用户的实际偏好;(2)在建模用户长期兴趣和短期偏好方面还存在着不足。

技术实现思路

[0006]本专利技术针对现有技术的不足,使用图神经网络等技术,挖掘用户长期兴趣和短期偏好,提出了一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法。
[0007]本专利技术通过以下技术方案实现:
[0008]一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法,所述方法具体包括以
下步骤:
[0009]步骤1:获得用户个人信息和用户交互序列数据集,将数据集进行预处理并分为训练集和测试集;
[0010]步骤2:构建基于图神经网络挖掘用户长短期兴趣的序列推荐模型;
[0011]步骤3:对步骤2所述基于图神经网络挖掘用户长短期兴趣的序列推荐模型进行训练;
[0012]步骤4:将待推荐用户的个人信息和交互序列输入到步骤3中训练后的基于图神经网络挖掘用户长短期兴趣的序列推荐模型,计算待推荐项目相对于该用户的推荐得分,根据推荐得分将项目推荐给用户。
[0013]进一步地,在步骤1中,
[0014]所述数据集包括用户的点击项目和评论数据;
[0015]所述步骤1具体为:
[0016]处理数据集中的数据:首先去掉用户交互的项目小于10的用户,去掉项目出现次数小于5的项目数;
[0017]读取用户对项目的评论:删除没有评论的项目,对于每个用户按照交互过的时间戳来进行重新排序;
[0018]最后生成PKL文件:数据处理完后,用户交互的系列表示为最后生成PKL文件:数据处理完后,用户交互的系列表示为I表示用户U交互的项目。
[0019]进一步地,在步骤2中,具体包含如下步骤:
[0020]步骤2.1:将数据集划分成用户交互的长期序列和短期序列;
[0021]将最近交互的5个项目为短期序列,其余交互的项目作为长期序列;
[0022]步骤2.2:获得用户个人信息嵌入表示向量和用户交互序列嵌入表示向量;
[0023]H
u,l
表示用户u交互的长期序列,L
u,l
表示用户u交互的短期序列,u
i
表示用户i的嵌入,e
i
表示项目i的嵌入;
[0024]步骤2.3:在长期序列上构建紧凑的项目

项目图,利用用户嵌入分辨噪声,图卷积神经网络更新图中节点信息,采用图池化技术和聚合函数聚合图中信息,得到用户的长期兴趣;
[0025]步骤2.4:在短期序列上采用两层门控网络来捕获项目特征,采用聚合函数得到用户的短期偏好;
[0026]步骤2.5:采用门控的方式来自适应的结合用户长期兴趣和短期偏好;公式如下:
[0027][0028][0029]其中g
u,l
为可学习门控参数,σ为激活函数,W
g5
、W
g6
、W
g7
为可学习的权重参数,u
i
为用户嵌入,为用户长期兴趣,为长期兴趣与短期偏好融合后序列表示,为用户短期偏好;
[0030]步骤2.6:在短期序列上采用双线性函数来捕获项目间的共现模式,得到结果向量
[0031]具体公式如下:
[0032][0033]其中e
i
是项目嵌入,W
r
是可学习权重参数。
[0034]进一步地,所述步骤2.3中具体为:
[0035](1)通过在项目之间做相似度计算,构建紧凑的item

item图,具体公式如下:
[0036]M
i,j
=cos(w

e
i
,w

e
j
)
[0037][0038]其中A
i,j
表示邻接矩阵,M
i,j
表示项目i与项目j之间的相似度打分,cos表述余弦计算,表示的是在M中第εn2大的数字,ε用来控制图的稀疏程度,n表示图中节点的数目,

表示为哈达玛积;
[0039](2)利用用户嵌入分辨噪声,图卷积神经网络更新图中节点信息;公式如下:
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法,其特征在于:所述方法具体包括以下步骤:步骤1:获得用户个人信息和用户交互序列数据集,将数据集进行预处理并分为训练集和测试集;步骤2:构建基于图神经网络挖掘用户长短期兴趣的序列推荐模型;步骤3:对步骤2所述基于图神经网络挖掘用户长短期兴趣的序列推荐模型进行训练;步骤4:将待推荐用户的个人信息和交互序列输入到步骤3中训练后的基于图神经网络挖掘用户长短期兴趣的序列推荐模型,计算待推荐项目相对于该用户的推荐得分,根据推荐得分将项目推荐给用户。2.根据权利要求1所述方法,其特征在于:在步骤1中,所述数据集包括用户的点击项目和评论数据;所述步骤1具体为:处理数据集中的数据:首先去掉用户交互的项目小于10的用户,去掉项目出现次数小于5的项目数;读取用户对项目的评论:删除没有评论的项目,对于每个用户按照交互过的时间戳来进行重新排序;最后生成PKL文件:数据处理完后,用户交互的系列表示为最后生成PKL文件:数据处理完后,用户交互的系列表示为I表示用户U交互的项目。3.根据权利要求2所述方法,其特征在于:在步骤2中,具体包含如下步骤:步骤2.1:将数据集划分成用户交互的长期序列和短期序列;将最近交互的5个项目为短期序列,其余交互的项目作为长期序列;步骤2.2:获得用户个人信息嵌入表示向量和用户交互序列嵌入表示向量;H
u,l
表示用户u交互的长期序列,L
u,l
表示用户u交互的短期序列,u
i
表示用户i的嵌入,e
i
表示项目i的嵌入;步骤2.3:在长期序列上构建紧凑的项目

项目图,利用用户嵌入分辨噪声,图卷积神经网络更新图中节点信息,采用图池化技术和聚合函数聚合图中信息,得到用户的长期兴趣;步骤2.4:在短期序列上采用两层门控网络来捕获项目特征,采用聚合函数得到用户的短期偏好;步骤2.5:采用门控的方式来自适应的结合用户长期兴趣和短期偏好;公式如下:公式如下:其中g
u,l
为可学习门控参数,σ为激活函数,W
g5
、W
g6
、W
g7
为可学习的权重参数,u
i
为用户嵌入,为用户长期兴趣,为长期兴趣与短期偏好融合后序列表示,为用户短期偏好;步骤2.6:在短期序列上采用双线性函数来捕获项目间的共现模式,得到结果向量
具体公式如下:其中e
i
是项目嵌入,W
r
是可学习权重参数。4.根据权利要求3所述方法,其特征在于:所述步骤2.3中具体为:(1)通过在项目之间做相似度计算,构建紧凑的item

item图,具体公式如下:M
i,j
=cos(w

e
i
,w

e
j
...

【专利技术属性】
技术研发人员:韩启龙刘东升宋洪涛李丽洁马志强王也王宇华
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1