一种基于协同知识图谱邻近采样的长尾推荐方法技术

技术编号:38710481 阅读:13 留言:0更新日期:2023-09-08 14:53
本发明专利技术公开一种基于协同知识图谱邻近采样的长尾推荐方法,包括如下步骤:构造用户

【技术实现步骤摘要】
一种基于协同知识图谱邻近采样的长尾推荐方法
[0001]技术邻域
[0002]本专利技术涉及推荐
,尤其是一种基于协同知识图谱邻近采样的长尾推荐方法。

技术介绍

[0003]推荐系统已经应用于生活中的各个领域,如网上购物、短视频推荐及各种搜索网站等等。目前,结合了神经网络的推荐系统凭借其推荐准确率逐渐成为推荐系统中的主流,然而在其模型训练过程中会使得模型偏向于向用户推荐流行物品,而许多长尾物品却无法出现在推荐列表中。对于用户来说,总是向他们推荐流行物品,推荐列表中缺少了长尾推荐所带来的偶然性和多样性,使用户感受到厌烦;对于企业来说,因长尾物品未被推荐,导致用户即使喜欢也难以看见及购买,影响了企业的利润。

技术实现思路

[0004]本专利技术是为了解决现有技术所存在的上述技术问题,提供一种基于协同知识图谱邻近采样的长尾推荐方法。
[0005]本专利技术的技术解决方案是:一种基于协同知识图谱邻近采样的长尾推荐方法,按照如下步骤进行:
[0006]步骤1.获取用户

物品二部图G1={(u,i)|u∈U,i∈I}、知识图谱
[0007]G2={(h,r,t)|h,t∈ε,r∈R}和协同知识图G3={(h,r,t)|h,t∈ε

,r∈R

};
[0008]所述二部图G1中,(u,i)表示用户u与物品i有过交互,U={u1,u2,...,u
|U|
}表示用户集合,I={i1,i2,...,i
|I|<br/>}表示物品集合,知识图谱G2中,ε={e1,e2,...,e
|ε|
}表示实体集合,R={r1,r2,...,r
|R|
}表示关系集合;协同知识图谱G3中,ε

=ε∪U,R

=R∪{交互},|U|表示用户的总数量,|I|表示物品的总数量,|ε|表示实体的总数量,|R|表示关系的总数量;
[0009]令用户u的一阶近邻的集合为N
u

[0010]令物品i的一阶近邻的集合为N
j

[0011]令属性e的一阶近邻的集合为N
e

[0012]步骤2.在协同知识图G3上为每个用户u随机采样协同路径;
[0013]从用户节点出发,有一阶邻居集合二阶邻居集合阶邻居集合在每一阶邻居集合中随机采样一个节点,并将这些节点连起来,得到一条长度为k个节点的协同路径,记作P
u
={e1,e2,...,e
k
},其中
[0014]重复上述过程多次,得到多条协同路径;
[0015]步骤3.按照式(1)计算每个用户的每一条协同路径的平均物品流行度;
[0016][0017]式(1)中,K表示路径中的节点数量;K

表示路径中的物品节点数量;a
k
是一个表示
第k个节点是否进行累加的参数,其值为0或1,当第k个节点为物品节点时,其值为1,反之为0;p
k
表示第k个节点的流行度,即该节点与用户节点的交互次数;
[0018]步骤4.选取平均物品流行度最低的X条路径P
x
中的所有物品节点替换用户原始的一阶近邻,作为用户u新的一阶近邻,即:
[0019][0020]步骤5.基于每个节点和邻居节点的关系生成注意力权重,并聚合邻居节点信息;
[0021]步骤5.1基于不同关系生成的注意力权重如下:
[0022]π

(h,r,t)=(W
r
e
t
)
T
tanh((W
r
e
h
+e
r
))
ꢀꢀ
(3)
[0023]其中W
r
是基于r关系下的可训练变换矩阵,e
h
,e
r
,e
t
分别对应头实体嵌入,关系嵌入,尾实体嵌入,T表示矩阵转置操作,再使用softmax进行标准化:
[0024][0025]步骤5.2.对所有以h为头实体的三元组使用式(5)进行加权求和得到邻居信息:
[0026][0027]其中,头实体h可以是用户节点,物品节点或实体节点,N
h
表示头实体h的邻居集合,表示头实体h的邻域信息的第l阶表示;
[0028]每个头实体的高阶表示由它的低阶嵌入表示和低阶的邻域信息求得:
[0029][0030]其中,W1,W2是可训练变换矩阵;
[0031]步骤6.将目标用户节点u和N
u
输入自注意力层,并将输出中的目标用户的嵌入作为最终的用户嵌入;
[0032]在自注意力层中,利用式(7)、(8)、(9)为输入的每个节点嵌入e
m
经由三个特征变换得到三个不同的向量:
[0033]Query
m
=W
Q
e
m
ꢀꢀ
(7)
[0034]Key
m
=W
K
e
m
ꢀꢀ
(8)
[0035]Value
m
=W
V
e
m
ꢀꢀ
(9)
[0036]上述式(7)、(8)、(9)中的W
Q
,W
K
,W
V
是可训练的变换矩阵,对于任意两个节点m,n,首先使用公式(7),(8),(9)将其转换,然后使用公式(10)、(11))计算节点m,n之间的注意力权重:
[0037]α
m,n
=Query
m
Key
n
ꢀꢀ
(10)
[0038]对上述式(10)使用一个softmax进行标准化:
[0039][0040]通过式(11)得到任意两个节点嵌入之间的自注意力权重以后,通过公式(12)加权求和计算每个节点的输出嵌入:
[0041][0042]步骤7.使用式(12)得到用户和物品的嵌入,最终通过内积进行预测评分:
[0043][0044][0045][0046]式(13)和式(14)对各阶用户嵌入和各阶物品嵌入进行串联;通过选取所述预测评分的降序排序集合的前N项作为推荐结果,并推荐给用户u。
[0047]本专利技术通过采样策略重构用户的一阶近邻,并在用户聚合一阶近邻信息前使用自注意力,能够有效的降低流行物品对推荐结果的影响,在保证推荐准确率的同时,能够提高推荐系统推荐长尾商品的能力。对于用户来说,长尾推荐增加了推荐偶然性和多样性,使用户感到惊喜;对于企业来说,因长尾物品的被推荐,使用户可以看见及购买,提高了企业的利润。
附图说明
[0048]图1为本专利技术实施例与对比例在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于协同知识图谱邻近采样的长尾推荐方法,其特征在于按照如下步骤进行:步骤1.获取用户

物品二部图G1={(u,i)|u∈U,i∈I}、知识图谱G2={(h,r,t)|h,t∈ε,r∈R}和协同知识图G3={(h,r,t)|h,t∈ε

,r∈R

};所述二部图G1中,(u,i)表示用户u与物品i有过交互,U={u1,u2,...,u
|U|
}表示用户集合,I={i1,i2,...,i
|I|
}表示物品集合,知识图谱G2中,ε={e1,e2,...,e
|ε|
}表示实体集合,R={r1,r2,...,r
|R|
}表示关系集合;协同知识图谱G3中,ε

=ε∪U,R

=R∪{交互},|U|表示用户的总数量,|I|表示物品的总数量,|ε|表示实体的总数量,|R|表示关系的总数量;令用户u的一阶近邻的集合为N
u
;令物品i的一阶近邻的集合为N
i
;令属性e的一阶近邻的集合为N
e
;步骤2.在协同知识图G3上为每个用户u随机采样协同路径;从用户节点出发,有一阶邻居集合二阶邻居集合阶邻居集合在每一阶邻居集合中随机采样一个节点,并将这些节点连起来,得到一条长度为k个节点的协同路径,记作P
u
={e1,e2,...,e
k
},其中重复上述过程多次,得到多条协同路径;步骤3.按照式(1)计算每个用户的每一条协同路径的平均物品流行度;式(1)中,K表示路径中的节点数量;K

表示路径中的物品节点数量;a
k
是一个表示第k个节点是否进行累加的参数,其值为0或1,当第k个节点为物品节点时,其值为1,反之为0;p
k
表示第k个节点的流行度,即该节点与用户节点的交互次数;步骤4.选取平均物品流行度最低的X条路径P
x
中的所有物品节点替换用户原始的一阶近邻,作为用户u新的一阶近邻,即:步骤5.基于每个节点和邻居节点的关系生成注意力权重,并聚合邻居节点信息;步骤5.1基于不同关系生成的注意力权重如下:π

(h,r,t)=(W
r
e
t
)
T
tanh((W
r
...

【专利技术属性】
技术研发人员:张志鹏张宇航王安琪周平磊张尧任永功
申请(专利权)人:辽宁师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1