基于注意力机制的知识图谱偏好预测推荐方法技术

技术编号:36380464 阅读:25 留言:0更新日期:2023-01-18 09:42
一种基于注意力机制的知识图谱偏好预测推荐方法,包括以下步骤:第一步、符号定义;第二步、偏好传播方法设计;第三步、基于偏好传播的资源推荐;第四步、基于缩放点积注意力的图上文表示;第五步、损失函数定义,最终计算结果来判断是否将项目v

【技术实现步骤摘要】
基于注意力机制的知识图谱偏好预测推荐方法


[0001]本专利技术涉及基于注意力机制的知识图谱偏好预测推荐方法。

技术介绍

[0002]知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其之间的关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱给互联网语义搜索带来了活力,同时也在智能问答中显示出强大威力,已经成为互联网知识驱动的智能应用的基础设施。知识图谱通常以三元组为基本结构进行表示,每个三元组(e
h
,r,e
t
)包含头实体e
h
,尾实体e
t
以及实体之间的相互关系r。
[0003]随着互联网技术的发展,信息技术为人类带来便捷的生活,然而一些问题也随之而来,其中数据爆炸带来的信息过载问题最为突出。基于知识图谱的推荐系统作为一种信息过滤系统,不仅可以解决信息过载问题,还对促进技术进步,提高生活质量有重要的现实意义。
[0004]最开始,基于知识图谱的推荐主要使用知识图谱中的关系进行推荐,也就是基于连接进行推荐。如Shi等人提出了SemRec方法,对异构信息网络和路径进行加权计算,通过区分路径的不同属性来描述路径的语义信息,最后利用用户对路径的偏好进行个性化推荐。最终SemRec将路径中所有用户的打分函数进行加权求和,作为目标用户对项目的偏好程度。然而基于连接的推荐系统严重依赖知识图谱的连接模式,对不同知识图谱进行推荐的效果并不理想。r/>[0005]许多研究人员开始尝试将知识图谱嵌入方法带入推荐系统中。如Wang等人提出了MKR方法,利用多层感知器和交叉压缩单元提取用户和项目的特征,然后将知识图谱中的实体与项目特征进行相似度判断,最终把高相似度的实体推荐给用户。Ma等人将使用知识图谱补全方法进行推荐,提出了RecKGC方法。RecKGC利用软注意力机制整合用户对项目的关注程度,然后计算用户和项目的整合向量之间的语义关联,最后根据关联结果对用户做出推荐。但是,目前在基于知识图谱进行推荐的方法中,使用基于嵌入或基于连接的方法已被证明有明显的缺陷,需要对知识图谱推荐方法做进一步研究以改进知识图谱推荐的精度。

技术实现思路

[0006]为了克服现有技术的不足,本专利技术提出了一种基于注意力机制的知识图谱偏好预测推荐方法,以知识图谱为主要信息来源,在知识图谱上进行推荐。推荐任务是根据用户的历史兴趣集来预测用户u
#
对项目的感兴趣程度。方法以用户u
#
的历史兴趣集和候选项目v
#
为输入,以用户u
#
喜欢项目v
#
的可能性P(u
#
,v
#
)为输出,本专利技术通过符号定义,偏好传播方法设计,基于偏好传播的资源推荐,基于缩放点积注意力的图上文表示,损失函数定义等步骤的最终计算结果来判断是否将项目v
#
加入用户u
#
的推荐列表。
[0007]为了解决上述技术问题本专利技术提供如下的技术方案:
[0008]一种基于注意力机制的知识图谱偏好预测推荐方法,包括以下步骤:
[0009]第一步、符号定义,过程如下:
[0010]已知一个用户集U
#
={u
#1
,u
#2
,...u

}和项目集V
#
={v
#1
,v
#2
,...v

},u

表示用户集中的第μ个用户,v

表示项目集中的第υ个项目,用户和项目之间的交互行为被放入一个交互矩阵其中的值只有两种,0或1,如果用户u
#
与项目v
#
有浏览、点击等交互行为,则否则等于0。每个用户都有一个历史兴趣集否则等于0。每个用户都有一个历史兴趣集表示用户u
#
的历史兴趣集中的第θ个元素,历史兴趣集中的元素代表与用户有交互行为的项目;U
#
和V
#
都是知识图谱G的一部分,知识图谱G={E,R,T},E表示实体(entity)的集合,R表示关系(relation)的集合,T表示正例三元组的集合。对于三元组(e
h
,r,e
t
),用v
#
e
h
,v
#
r,v
#
e
t
分别表示e
h
,r,e
t
在项目向量空间中的嵌入。项目被视为知识图谱中的实体,V
#
∈E,项目集V
#
中的项目被视为对用户进行推荐的候选项目,若候选项目在交互矩阵中已经与用户有过交互,则将该项目从候选项目中移除,候选项目集合被定义为:本专利技术的目标是预测用户会喜欢或者说点击候选项目v
#g
的概率;
[0011]第二步、偏好传播方法设计;
[0012]第三步、基于偏好传播的资源推荐;
[0013]第四步、基于缩放点积注意力的图上文表示;
[0014]第五步、损失函数定义,最终计算结果来判断是否将项目v
#
加入用户u
#
的推荐列表。
[0015]进一步,所述第二步的过程如下:
[0016]步骤(2.1)、将用户的历史数据视为种子,在知识图谱中以种子为中心,顺着关系路径p=(r1,r2,...r
l
)向外扩散,r
l
表示关系路径中的第l条关系,每一次迭代沿着关系的方向传播到下一个实体,为了用知识图谱描述用户的多层偏好,为用户u
#
划分了多跳的相关实体集,一个k跳的相关实体集被定义为:
[0017][0018]其中表示用户的历史兴趣集,即与用户有过交互行为的项目集合。H表示k所取的最大值。表示相关实体集中e
t
的可取范围;
[0019]步骤(2.2)、相关实体被视为用户在知识图谱中兴趣的自然扩展,这些自然扩展在知识图谱中表现为从历史兴趣项目向外一层层扩散的圆,简称为波纹圆,一层波纹圆中相关实体组成的三元组的集合被称为波纹集。用户u
#
的k跳波纹集定义如下:
[0020][0021]步骤(2.3)、在波纹集向外扩散的过程中,本专利技术会关注每一跳的相关实体集,若在中发现了v
#g
的存在,波纹集会继续向外扩散直到第H跳停止,若在第H跳的中仍然没有发现v
#g
的存在,则H=H+1,波纹集会继续向外扩散直到v
#g
被纳入中,此时k
*
=H;
[0022]步骤(2.4)、在波纹集停止扩散后,整理到中的所有三元组,并按照在中的出现顺序将实体和关系重构成一张由实体和关本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的知识图谱偏好预测推荐方法,其特征在于,所述方法包括以下步骤:第一步、符号定义,过程如下:已知一个用户集U
#
={u
#1
,u
#2
,...u

}和项目集V
#
={v
#1
,v
#2
,...v

},u

表示用户集中的第μ个用户,v

表示项目集中的第υ个项目,用户和项目之间的交互行为被放入一个交互矩阵其中的值只有两种,0或1,如果用户u
#
与项目v
#
有浏览、点击交互行为,则否则等于0,每个用户都有一个历史兴趣集否则等于0,每个用户都有一个历史兴趣集表示用户u
#
的历史兴趣集中的第θ个元素,历史兴趣集中的元素代表与用户有交互行为的项目;U
#
和V
#
都是知识图谱G的一部分,知识图谱G={E,R,T},E表示实体的集合,R表示关系的集合,T表示正例三元组的集合,对于三元组(e
h
,r,e
t
),用v
#
e
h
,v
#
r,v
#
e
t
分别表示e
h
,r,e
t
在项目向量空间中的嵌入,项目被视为知识图谱中的实体,V
#
∈E,项目集V
#
中的项目被视为对用户进行推荐的候选项目,若候选项目在交互矩阵中已经与用户有过交互,则将该项目从候选项目中移除,候选项目集合被定义为:目标是预测用户会喜欢或者说点击候选项目v
#g
的概率;第二步、偏好传播方法设计;第三步、基于偏好传播的资源推荐,过程如下;步骤(3.1)、在知识图谱中,一个用户有多个历史项目,为了能够适应复杂的知识图谱,在历史项目和候选项目v
#g
之间的图结构可以表示为:S0→
S1→
S2...

S
l


表示从上一个节点传播到下一个节点,其中一个节点传播到下一个节点,其中S
i
表示历史项目到候选项目之间的第i个节点,实体从上一个波纹集中得到的资源被定义为:从上一个波纹集中得到的资源被定义为:表示波纹集中所有尾实体是的三元组,表示波纹集中所有头实体是的三元组,定义用户的初始资源为R
p
(all)=1,在推荐系统中,用户的初始资源表示用户对项目的兴趣,假设用户对每个历史项目的感兴趣程度一致,则每个历史项目的兴趣步骤(3.2)、用户对候选项目v
#g
的兴趣,可以定义为用户从所有历史项目出发,沿着和v
#g
之间的路径,最终到达v
#g
的资源量,在资源流动的过程中,从多个历史项目出发的路径之间很可能会产生交互,有实体在多条路径的交点上,就如同线段之间的交点,此时交点实体的资源量是多个直接前身资源量的总和,身处交叉点的实体代表用户很有可能更喜欢这个相关实体,最终,记候选项目v
#g
的兴趣资源量为Resv
#g
;第四步、基于缩放点积注意力的图上文表示;第五步、损失函数定义,最终计算结果来判断是否将项目v
#
加入用户u
#
的推荐列表。2.如权利要求1所述的基于注意力机制的知识图谱偏好预测推荐方法,其特征在于,所
述第二步的过程如下:步骤(2.1)、将用户的历史数据视为种子,在知识图谱中以种子为中心,顺着关系路径p=(r1,r2,...r
l
)向外扩散,r
l
表示关系路径中的第l条关系,每一次迭代沿着关系的方向传播到下一个实体,为了用知识图谱描述用户的多层偏好,为用户u
#
划分了多跳的相关实体集,一个k跳的相关实体集被定义为:其中表示用户的历史兴趣集,即与用户有过交互行为的项目集合,H表示k所取的最大值,表示相关实体集中e
t
的可取范围;步骤(2.2)、相关实体被视为用户在知识图谱中兴趣的自然扩展,这些自然扩展在知识图谱中表现为从历史兴趣项目向外一层层扩散的圆,简称为波纹圆,一层波纹圆中相关实体组成的三元组的集合被称为波纹集,用户u
#
的k跳波纹集定义如下:步骤(2.3)、在波纹集向外扩散的过程中,关注每一跳的相关实体集,若在中发现了v
#g
的存在,波纹集会继续向外扩散直到第H跳停止,若在第H跳的中仍然没有发现v
#g
的存在,则H=H+1,波纹集会继续向外扩散直到v
#g
被纳入中,此时k
*
=H;步骤(2.4)、在波纹集停止扩散后,整理到中的所有三元组,并按照在中的出现顺序将实体和关系重构成一张由实体和关系构成的用户兴趣图g,g是知识图谱G的子集,表示用户的兴趣集合。3.如权利要求1或2所述的基于注意力机制的知识图谱偏好预测推荐方法,其...

【专利技术属性】
技术研发人员:陆佳炜李家朋朱昊天肖刚王琪冰李琛徐俊程振波吴俚达王志鹏
申请(专利权)人:中国计量大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1