一种基于传播范围自适应的协同过滤方法及系统技术方案

技术编号：39580651 阅读：8 留言：0更新日期：2023-12-03 19:31

一种基于传播范围自适应的协同过滤方法及系统，涉及推荐技术领域，用以区分推荐系统中实体不同属性的传播范围

全部详细技术资料下载

【技术实现步骤摘要】
一种基于传播范围自适应的协同过滤方法及系统

[0001]本专利技术涉及推荐
，特别涉及基于图神经网络的传播范围自适应的协同过滤方法及系统
。

技术介绍

[0002]个性化推荐在解决几乎所有在线服务
(
如电子商务
、
社交媒体网站和在线视频网站等
)
中出现的信息过载问题方面发挥了关键作用
。
协同过滤方法利用用户与物品的交互历史来预测用户的潜在兴趣，成为主流的推荐方法
。
协同过滤的核心思想在于假设具有相似兴趣的用户会表现出相似的行为
。
因此，挖掘隐藏在用户与物品之间众多交互行为中的潜在分布模式是研究的核心问题
。
[0003]针对上述问题，业界提出了多种基于协同过滤的推荐模型
。
大多数基于协同过滤的推荐方法所遵循的核心范式在于推荐系统中实体的学习表示，并利用相应的实体表示来完成用户与物品之间的交互预测
。
因此，根据表征获取和交互预测的过程，目前广泛使用的基于协同过滤的推荐方法主要可以分为三类，即
(1)
基于因子分解机的协同过滤，
(2)
基于矩阵分解的协同过滤，以及
(3)
基于图神经网络的协同过滤
。
基于因子分解机的协同过滤模型将上下文信息分解为域特征，并通过低维特征线性乘法表达高阶域的相互作用
。
基于矩阵分解的协同过滤模型将推荐系统中的用户和物品映射到共享的低维潜...

【技术保护点】

【技术特征摘要】
1.
一种基于传播范围自适应的协同过滤方法，其特征在于，所述方法用于预测用户
‑
物品间的缺失交互记录，所述方法为：针对细粒度的实体多属性以及自适应传播范围，定义
PDA
‑
GNN
模型为：该模型框架利用用户和物品交互背后的实体属性多样性来提高推荐性能，框架包含四个主要部分：嵌入层
、
卷积层
、
注意力层以及预测层；嵌入层将用户和物品的
ID
映射到密集的嵌入向量上，每个节点拥有多个属性嵌入，其中每个用户的嵌入数量与
GNN
的最大传播深度一致；接下来，卷积层完成节点嵌入的传播和聚集，形成图上的嵌入聚集过程；然后，注意力层计算每个节点的属性嵌入注意力系数，并将多个属性嵌入整合到最终的嵌入表示中；最后，预测层根据用户与物品的最终嵌入表示完成用户与物品之间交互得分的预测
。2.
根据权利要求1所述的一种基于传播范围自适应的协同过滤方法，其特征在于，所述方法的具体实现过程为：基本定义：已知用户集合
U
＝
{u1，
u2，
…
，
u
M
}
，物品集合
I
＝
{i1，
i2，
…
，
i
N
}
，以及用户
‑
物品交互历史记录其中
r
ui
∈R
表示任意用户
u
与任意物品
i
的交互记录，
M
表示用户数量，
N
表示物品数量；用户
‑
物品的交互记录可以通过一个二部图进行表示，其中
u∈U
表示任意用户，
i∈I
表示任意物品，
E
中的任意连边表示用户与物品之间的交互；对于任意交互
r
ui
∈R
，
r
ui
＝0表示用户
u
与物品
i
之间没有交互；反之，如果
r
ui
≠0
，则用户
u
与物品
i
之间曾有过交互；目标在于预测用户
‑
物品间的缺失交互记录即嵌入层以用户和物品
ID
为输入，输出其对应的密集嵌入，嵌入层的实现过程如下：使用嵌入表示检查表来完成不同属性嵌入的初始化，在
PDA
‑
GNN
中，每个节点有多个属性嵌入，不同的嵌入在图上具有不同的传播范围；用示用户
u
在第0层的第
l
个属性，其中
d
表示嵌入大小，
l∈{0
，1，
…
，
L}
用于标记属性的标号
(
索引
)
，其中
L
表示实体的属性嵌入总数
(
也即图神经网络的最大传播范围
)
；用户
u
的第
l
个属性嵌入的最大传播范围为
l
跳，在
l
跳之后可以得到最终的嵌入表示；即，对于任意用户
u
，属性嵌入分别在传播0，1，
…
，
L
跳之后完成最终的属性嵌入表示；表示物品
i
的第
l
个属性嵌入的初始化值；模型以端到端的方式进行训练，属性嵌入作为可训练变量随着模型训练而得到优化，最终获得优化值
。
卷积层对每个用户和物品进行属性嵌入的传播和集成，在获得嵌入层中每个节点的属性嵌入后，嵌入需要在卷积层中传播；先描述单跳属性的传播过程，再将其推广到多跳传播：单跳属性传播对于任意相邻的用户
‑
物品邻居二元组
(u
，
i)
，本发明定义从物品
i
到用户
u
的信息传播如下：其中为经过单跳传播层从物品
i
到用户
u
的消息传递，
f(
·
)
为消息传播函数；
e
i
和
e
u
分别表示用户
u
和物品
i
的嵌入；
λ
u
，
i
(
·
)
表示用户
u
和物品
i
之间的归一化函数，用于规范它们之间的消息传递；对于消息传播函数
f(
·
)
与归一化衰减范式
λ
u
，
i
(
·
)
的不同设计用于完成不同图神经网络之间的信息传播；多跳属性传播
PDA
‑
GNN
通过叠加多个图卷积层来模拟多跳信息的传播，用于将影响扩散到更大的范围，通过将单跳卷积层上的消息传递过程扩展到更高阶的消息传播过程，单类型属性
(1)
嵌入的多跳信息传递可以定义如下：入的多跳信息传递可以定义如下：其中，

【专利技术属性】
技术研发人员：何慧，武兴隆，杨洪伟，邰煜，张伟哲，王泽俊，
申请(专利权)人：哈尔滨工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人