一种基于传播范围自适应的协同过滤方法及系统技术方案

技术编号:39580651 阅读:8 留言:0更新日期:2023-12-03 19:31
一种基于传播范围自适应的协同过滤方法及系统,涉及推荐技术领域,用以区分推荐系统中实体不同属性的传播范围

【技术实现步骤摘要】
一种基于传播范围自适应的协同过滤方法及系统


[0001]本专利技术涉及推荐
,特别涉及基于图神经网络的传播范围自适应的协同过滤方法及系统


技术介绍

[0002]个性化推荐在解决几乎所有在线服务
(
如电子商务

社交媒体网站和在线视频网站等
)
中出现的信息过载问题方面发挥了关键作用

协同过滤方法利用用户与物品的交互历史来预测用户的潜在兴趣,成为主流的推荐方法

协同过滤的核心思想在于假设具有相似兴趣的用户会表现出相似的行为

因此,挖掘隐藏在用户与物品之间众多交互行为中的潜在分布模式是研究的核心问题

[0003]针对上述问题,业界提出了多种基于协同过滤的推荐模型

大多数基于协同过滤的推荐方法所遵循的核心范式在于推荐系统中实体的学习表示,并利用相应的实体表示来完成用户与物品之间的交互预测

因此,根据表征获取和交互预测的过程,目前广泛使用的基于协同过滤的推荐方法主要可以分为三类,即
(1)
基于因子分解机的协同过滤,
(2)
基于矩阵分解的协同过滤,以及
(3)
基于图神经网络的协同过滤

基于因子分解机的协同过滤模型将上下文信息分解为域特征,并通过低维特征线性乘法表达高阶域的相互作用

基于矩阵分解的协同过滤模型将推荐系统中的用户和物品映射到共享的低维潜在空间中,将用户和物品的表示关联起来,并应用低秩密集矩阵乘法执行预测操作

基于图神经网络的协同过滤模型将传统的矩阵补全问题转化为二部图的连边预测问题,通过节点的嵌入表示提取个体表征,利用图的结构信息预测用户兴趣扩散过程中缺失的交互

[0004]现有方法都将推荐系统中的个体简单地视为单个嵌入向量或分解项,不足以表达协同过滤环境下实体的属性多样性

然而,推荐系统中的实体
(
即用户及物品
)
具有多样化的属性,因此,实体的多个属性共同决定了实体之间的交互

此外,实体的不同属性具有各自不同的传播范围,实体属性的不同表现侧面对目标邻居的影响也不同

将实体作为一个嵌入表示项不能全面地反映实体间复杂多样的交互过程

因此,如果我们能够很好地利用这种属性多样性,就有可能描述实体的整体属性并提高推荐的准确性

[0005]文献号为
CN114266353A
的现在技术公开了一种基于图神经网络的协同过滤模型设计方法,其对基于图神经网络的协同过滤设计空间进行了剖析,加深了领域学者对模型不同设计维度的理解,为推荐场景下的图神经网络方法设计提供了一种新的范式

但是没有区分推荐系统中实体不同属性的传播范围


技术实现思路

[0006]本专利技术要解决的技术问题是:
[0007]本专利技术的目的是提供一种基于传播范围自适应的协同过滤方法及系统
(
即提供了一种具有传播范围自适应感知的推荐系统模型
)
,用以区分推荐系统中实体不同属性的传播范围,从而完成不同传播范围属性嵌入表示的差异化传播

[0008]本专利技术为解决上述技术问题所采用的技术方案为:
[0009]一种基于传播范围自适应的协同过滤方法,所述方法用于预测用户

物品间的缺失交互记录,所述方法为:
[0010]针对细粒度的实体多属性以及自适应传播范围,定义
PDA

GNN
模型为:该模型框架利用用户和物品交互背后的实体属性多样性来提高推荐性能,框架包含四个主要部分:嵌入层

卷积层

注意力层以及预测层;
[0011]嵌入层将用户和物品的
ID
映射到密集的嵌入向量上,每个节点拥有多个属性嵌入,其中每个用户的嵌入数量与
GNN
的最大传播深度一致;接下来,卷积层完成节点嵌入的传播和聚集,形成图上的嵌入聚集过程;然后,注意力层计算每个节点的属性嵌入注意力系数,并将多个属性嵌入整合到最终的嵌入表示中;最后,预测层根据用户与物品的最终嵌入表示完成用户与物品之间交互得分的预测

[0012]所述方法的具体实现过程为:
[0013]基本定义:已知用户集合
U

{u1,
u2,


u
M
}
,物品集合
I

{i1,
i2,


i
N
}
,以及用户

物品交互历史记录其中
r
ui
∈R
表示任意用户
u
与任意物品
i
的交互记录,
M
表示用户数量,
N
表示物品数量;用户

物品的交互记录可以通过一个二部图
g

(U

I

E)
进行表示,其中
u∈U
表示任意用户,
i∈I
表示任意物品,
E
中的任意连边表示用户与物品之间的交互;对于任意交互
r
ui
∈R

r
ui
=0表示用户
u
与物品
i
之间没有交互;反之,如果
r
ui
≠0
,则用户
u
与物品
i
之间曾有过交互;
[0014]目标在于预测用户

物品间的缺失交互记录即
[0015]嵌入层以用户和物品
ID
为输入,输出其对应的密集嵌入,嵌入层的实现过程如下:
[0016]使用嵌入表示检查表来完成不同属性嵌入的初始化,在
PDA

GNN
中,每个节点有多个属性嵌入,不同的嵌入在图上具有不同的传播范围;用示用户
u
在第0层的第
l
个属性,其中
d
表示嵌入大小,
l∈{0
,1,


L}
用于标记属性的标号
(
索引
)
,其中
L
表示实体的属性嵌入总数
(
也即图神经网络的最大传播范围
)
;用户
u
的第
l
个属性嵌入的最大传播范围为
l
跳,在
l
跳之后可以得到最终的嵌入表示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于传播范围自适应的协同过滤方法,其特征在于,所述方法用于预测用户

物品间的缺失交互记录,所述方法为:针对细粒度的实体多属性以及自适应传播范围,定义
PDA

GNN
模型为:该模型框架利用用户和物品交互背后的实体属性多样性来提高推荐性能,框架包含四个主要部分:嵌入层

卷积层

注意力层以及预测层;嵌入层将用户和物品的
ID
映射到密集的嵌入向量上,每个节点拥有多个属性嵌入,其中每个用户的嵌入数量与
GNN
的最大传播深度一致;接下来,卷积层完成节点嵌入的传播和聚集,形成图上的嵌入聚集过程;然后,注意力层计算每个节点的属性嵌入注意力系数,并将多个属性嵌入整合到最终的嵌入表示中;最后,预测层根据用户与物品的最终嵌入表示完成用户与物品之间交互得分的预测
。2.
根据权利要求1所述的一种基于传播范围自适应的协同过滤方法,其特征在于,所述方法的具体实现过程为:基本定义:已知用户集合
U

{u1,
u2,


u
M
}
,物品集合
I

{i1,
i2,


i
N
}
,以及用户

物品交互历史记录其中
r
ui
∈R
表示任意用户
u
与任意物品
i
的交互记录,
M
表示用户数量,
N
表示物品数量;用户

物品的交互记录可以通过一个二部图进行表示,其中
u∈U
表示任意用户,
i∈I
表示任意物品,
E
中的任意连边表示用户与物品之间的交互;对于任意交互
r
ui
∈R

r
ui
=0表示用户
u
与物品
i
之间没有交互;反之,如果
r
ui
≠0
,则用户
u
与物品
i
之间曾有过交互;目标在于预测用户

物品间的缺失交互记录即嵌入层以用户和物品
ID
为输入,输出其对应的密集嵌入,嵌入层的实现过程如下:使用嵌入表示检查表来完成不同属性嵌入的初始化,在
PDA

GNN
中,每个节点有多个属性嵌入,不同的嵌入在图上具有不同的传播范围;用示用户
u
在第0层的第
l
个属性,其中
d
表示嵌入大小,
l∈{0
,1,


L}
用于标记属性的标号
(
索引
)
,其中
L
表示实体的属性嵌入总数
(
也即图神经网络的最大传播范围
)
;用户
u
的第
l
个属性嵌入的最大传播范围为
l
跳,在
l
跳之后可以得到最终的嵌入表示;即,对于任意用户
u
,属性嵌入分别在传播0,1,


L
跳之后完成最终的属性嵌入表示;表示物品
i
的第
l
个属性嵌入的初始化值;模型以端到端的方式进行训练,属性嵌入作为可训练变量随着模型训练而得到优化,最终获得优化值

卷积层对每个用户和物品进行属性嵌入的传播和集成,在获得嵌入层中每个节点的属性嵌入后,嵌入需要在卷积层中传播;先描述单跳属性的传播过程,再将其推广到多跳传播:单跳属性传播对于任意相邻的用户

物品邻居二元组
(u

i)
,本发明定义从物品
i
到用户
u
的信息传播如下:其中为经过单跳传播层从物品
i
到用户
u
的消息传递,
f(
·
)
为消息传播函数;
e
i

e
u
分别表示用户
u
和物品
i
的嵌入;
λ
u

i
(
·
)
表示用户
u
和物品
i
之间的归一化函数,用于规范它们之间的消息传递;对于消息传播函数
f(
·
)
与归一化衰减范式
λ
u

i
(
·
)
的不同设计用于完成不同图神经网络之间的信息传播;多跳属性传播
PDA

GNN
通过叠加多个图卷积层来模拟多跳信息的传播,用于将影响扩散到更大的范围,通过将单跳卷积层上的消息传递过程扩展到更高阶的消息传播过程,单类型属性
(1)
嵌入的多跳信息传递可以定义如下:入的多跳信息传递可以定义如下:其中,

【专利技术属性】
技术研发人员:何慧武兴隆杨洪伟邰煜张伟哲王泽俊
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1