一种基于自监督图学习的会话推荐方法、系统及设备技术方案

技术编号:34772114 阅读:67 留言:0更新日期:2022-08-31 19:35
本发明专利技术公开了一种基于自监督图学习的会话推荐方法、系统及设备,该方法包括:从会话集中获取当前会话,通过图注意力网络进行信息传播学习当前会话中的每个物品表示,并通过生成用户的长期兴趣和短期兴趣得到会话表示;根据会话集建立显示全局图,从中获取物品之间的连接信息和非连接信息生成自监督信号,计算自监督损失;利用会话表示获取每个候选物品的预测推荐概率;对候选集进行目标自适应屏蔽处理获得新的候选集,计算主监督损失;根据自监督损失和主监督损失获得综合损失,并通过综合损失更新物品表示和网络参数,以优化每个候选物品的预测推荐概率。本发明专利技术实现了优化物品推荐,有效提高推荐准确度的目的。有效提高推荐准确度的目的。有效提高推荐准确度的目的。

【技术实现步骤摘要】
一种基于自监督图学习的会话推荐方法、系统及设备


[0001]本专利技术涉及推荐系统
,尤其涉及一种基于自监督图学习的会话推荐方法、系统及设备。

技术介绍

[0002]随着互联网信息的快速增长,推荐系统作为解决信息超载问题的一种有效方法,可以帮助人们在面对丰富的产品或服务时做出准确的选择。传统的推荐方法,例如协同过滤推荐主要关注用户的长期静态偏好而忽略他们的短期互动行为,可能会导致推荐不准确,此外现实中的某些场景用户长期的历史互动行为难以获取。因此,会话推荐系统被提出,通过建模用户短期内有限的交互行为来生成推荐。
[0003]传统的会话推荐方法可以采用马尔可夫链(Markov Chain,MC)来捕获相邻交互之间的顺序依赖关系。考虑到循环神经网络(Recurrent Neural Network,RNN)应用在顺序数据建模中的优势,有人提出利用门控循环单元(Gated Recurrent Unit,GRU)对会话序列进行建模,并引入批量并行训练等措施优化GRU使其更适应会话推荐任务。此外,还有人采用注意力机制来获得物品的重要性,这可本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于自监督图学习的会话推荐方法,其特征在于,包括:获取会话集,该会话集包含n个会话;从所述会话集中获取当前会话,通过图注意力网络进行信息传播学习所述当前会话中的每个物品表示,并通过生成用户的长期兴趣和短期兴趣得到会话表示;根据所述会话集建立显示不同会话之间物品连接的全局图,从所述全局图中获取物品之间的连接信息和非连接信息生成自监督信号,并根据所述自监督信号计算自监督损失;获取包含m个候选物品的候选集,并利用所述会话表示获取每个所述候选物品的预测推荐概率;对所述候选集进行目标自适应屏蔽处理获得新的候选集,并根据新的候选集计算主监督损失;根据所述自监督损失和所述主监督损失获得综合损失,并通过所述综合损失更新所述物品表示和所述图注意力网络的网络参数,以优化每个所述候选物品的预测推荐概率;在综合损失小于预设值时,结束推荐优化,并获取每个所述候选物品的最优推荐概率。2.根据权利要求1所述的基于自监督图学习的会话推荐方法,其特征在于,所述从所述会话集中获取当前会话,通过图注意力网络进行信息传播学习所述当前会话中的每个物品表示,并通过生成用户的长期兴趣和短期兴趣得到会话表示,包括:根据当前会话构建局部图,该局部图表示为:G
τ
={V
τ
,E
τ
},其中V
τ
为所述局部图的节点集合,包含所述当前会话中所有的物品;E
τ
为所述局部图的边集合,包含所述当前会话中物品之间的成对传递关系;将所述局部图输入图注意力网络,在所述图注意力网络上进行信息传播后获取所述局部图中每个节点的嵌入向量;根据所述每个节点的嵌入向量,从所述局部图中恢复物品之后,得到当前会话中按时间顺序排列的物品表示序列;将所述物品表示序列中最后一个物品的嵌入表示确定为用户的短期兴趣,并通过注意力机制聚合所述物品的嵌入表示生成用户的长期兴趣;根据所述用户的短期兴趣和长期兴趣生成会话表示。3.根据权利要求2所述的基于自监督图学习的会话推荐方法,其特征在于,所述用户的长期兴趣表示为:γ
i
=softmax(β
i
),β
i
=W4σ(W5u
i
+W6C
s
),其中,C
l
为用户的长期兴趣;C
s
为用户的短期兴趣;W4、W5和W6为注意力机制的权重参数;softmax()为softmax函数;σ为sigmoid函数。4.根据权利要求2所述的基于自监督图学习的会话推荐方法,其特征在于,所述将所述局部图输入图注意力网络,在所述图注意力网络上进行信息传播后获取所述局部图中每个节点的嵌入向量,包括:通过所述图注意力网络的嵌入层获取所述局部图中每个节点x
i
的初始嵌入向量;对于第l层的节点x
i
,通过所述图注意力网络中的自注意力机制获取所述节点x
i
与其相
邻节点x
j
之间的注意系数;通过所述通过图注意力网络的softmax层对所述注意系数进行归一化处理,得到归一化系数;将所述节点x
i
的邻居节点信息进行组合,并利用所述归一化系数更新所述节点x
i
的嵌入向量,得到新的嵌入向量。5.根据权利要求1所述的基于自监督图学习的会话推荐方法,其特征在于,所述根据所述会话集建立显示不同会话之间物品连接的全局图,从所述全局图中获取物品之间的连接信息和非连接信息生成自监督信号,并根据所述自监督信号计算自监督损失,包括:根据所述会话集中的n个会话构建全局图;对于所述当前会话中的每个物品v
i
,在所述全局图上获取物品v
i
的邻居节点v
j
和非邻居节点其中,邻居节点数与非邻居节点数相同;通过JS散度计算自监督损失,该自监督损失用于最大化物品v
i
与邻居节点v
j
的距离,最小化物品v
i
与非邻居节点之间的距离,具体表示为:其中,L
self
为自监督损失;u
i
为物品v
i
的嵌入表示;u
j
为邻居节点v
j
对应的嵌入表示;为非邻居节点对...

【专利技术属性】
技术研发人员:蔡飞王祎童刘登峰王思远李佩宏宋城宇张鑫陈洪辉张维明
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1