对比学习增强的协同知识图谱推荐模型构建方法技术

技术编号:38661383 阅读:11 留言:0更新日期:2023-09-02 22:44
本申请涉及一种对比学习增强的协同知识图谱推荐模型构建方法,通过设计三个对比学习任务来补充推荐监督任务,可以缓解由于监督信号稀疏、长尾效应、噪声干扰等问题导致图神经网络学习到的节点表征不准确的问题;同时,为了对比学习能更有益于推荐任务,在节点表征和对比学习之间引入一个包含两个线性层的多层感知机帮助对比学习训练,本申请促进了基于知识图谱的推荐系统的发展,具有现实意义。具有现实意义。具有现实意义。

【技术实现步骤摘要】
对比学习增强的协同知识图谱推荐模型构建方法


[0001]本申请涉及知识图谱推荐领域,具体地,涉及一种对比学习增强的协同知识图谱推荐模型构建方法。

技术介绍

[0002]知识图谱中蕴含着大量实体以及实体之间关系的信息,这可以作为一种有效的辅助信息丰富用户和项目的描述,在推荐系统中利用知识图谱可以有效缓解数据稀疏和冷启动问题,并对推荐结果提供可解释性。具体地,一些研究通过对知识图谱中的实体和关系进行表征,进而将知识图谱中蕴含的语义信息带入到推荐系统的用户和项目上,从而提升推荐系统的效果。另外,一些研究者通过将知识图谱和原有的用户

项目的交互数据构成一个异质信息网络图,挖掘图上用户到项目之间不同的路径,提升推荐效果。随着图神经网络的不断发展,结合GNN的推荐模型被提出,代表性地,KGCN模型使用图卷积神经网络处理知识图谱,从而得到用户的高阶个性化偏好信息。KGAT模型结合TransR和GNN的思想,在协同知识图谱上建模用户和项目之间的高阶关系。然而,目前基于知识图谱的推荐模型均是将用户和项目之间的交互数据作为监督信息,但是这种交互数据对于整个交互空间而言是非常稀疏的,导致无法学习到足够好的用户和项目的节点表征。其次,推荐算法的成功很大程度上依赖于高质量的知识图谱,然而实际应用数据集中知识图谱的实体都表现出长尾现象(即少部分实体节点的边很多,大部分实体节点的边很少),这给准确捕捉推荐系统中项目的关联性带来了挑战。最后,用户和项目的交互数据中存在的噪声(用户误点击了某个项目)也会影响模型对用户偏好的准确学习

技术实现思路

[0003]为了克服现有技术中的至少一个不足,本申请提供一种对比学习增强的协同知识图谱推荐模型构建方法。
[0004]第一方面,提供一种对比学习增强的协同知识图谱推荐模型构建方法,包括:
[0005]获取协同知识图谱训练集;协同知识图谱训练集包括多个协同知识图谱;协同知识图谱中的节点包括用户节点、项目节点和实体节点;
[0006]将每个协同知识图谱输入到数据增强模块进行数据增强,得到第一子视图和第二子视图;
[0007]将第一子视图和第二子视图输入到节点表征提取模块,分别对第一子视图和第二子视图进行节点表征提取,分别得到每个节点的第一表征和每个节点的第二表征;
[0008]对每个节点的第一表征挖掘相关特征,得到每个节点的第三表征,以及对每个节点的第二表征挖掘相关特征,得到每个节点的第四表征;
[0009]基于每个节点的第三表征和每个节点的第四表征,构建损失函数;
[0010]基于损失函数对数据增强模块和节点表征提取模块进行训练,得到训练后的数据增强模块和训练后的节点表征提取模块,训练后的数据增强模块和训练后的节点表征提取
模块构成对比学习增强的协同知识图谱推荐模型。
[0011]在一个实施例中,将每个协同知识图谱输入到数据增强模块进行数据增强,得到第一子视图和第二子视图,包括:
[0012]按照随机删除比率ρ分别生成用于删除边的第一向量和第二向量;
[0013]第一向量作用于协同知识图谱,得到第一子视图;
[0014]第二向量作用于协同知识图谱,得到第二子视图。
[0015]在一个实施例中,节点表征提取模块包括第一GNN模块和第二GNN模块,第一GNN模块用于对第一子视图进行节点表征提取,得到每个节点的第一表征;第二GNN模块用于对第二子视图进行节点表征提取,得到每个节点的第二表征。
[0016]在一个实施例中,对每个节点的第一表征挖掘相关特征,得到每个节点的第三表征,采用以下公式:
[0017][0018]其中,Z

x
为每个节点的第三表征,σ为激活函数,W2和W1均为第一多层感知机的训练参数,为每个节点的第一表征,b1和b2均为偏差参数;
[0019]对每个节点的第二表征挖掘相关特征,得到每个节点的第四表征,采用以下公式:
[0020][0021]其中,Z”x
为每个节点的第四表征,σ为激活函数,Q2和Q1均为第二多层感知机的训练参数,为每个节点的第二表征,b1和b2均为偏差参数。
[0022]在一个实施例中,基于每个节点的第三表征和每个节点的第四表征,构建损失函数,包括:
[0023]构建用户侧损失函数
[0024][0025]其中,U为用户节点集合,u≠v,s为余弦函数,Z

u
为用户节点u的第三表征,Z”u
为用户节点u的第四表征,τ为温度超参数,Z”v
为用户节点v的第四表征;
[0026]构建用户项目交互侧损失函数
[0027][0028]其中,I为项目节点集合,i∈I,g∈I,i为用户交互过的项目节点,g为用于未交互过的项目节点,Z”i
为项目节点i的第四表征,Z”g
为项目节点g的第四表征;
[0029]构建实体侧损失函数
[0030][0031]其中,E为实体节点集合,e≠m,Z

e
为实体节点e的第三表征,Z”e
为实体节点e的第四表征,Z”m
为实体节点m的第四表征;
[0032]构建对比学习损失函数
[0033][0034]构建贝叶斯个性化排名损失
[0035][0036][0037][0038]其中,O为用户节点和项目节点交互的数据记录,表示用户节点u交互过的项目节点i的样本得分,表示用户节点u未交互过的项目节点g的样本得分;为用户节点u的第一表征或者第二表征,为项目节点i的第一表征或者第二表征,为项目节点g的第一表征或者第二表征;
[0039]构建损失函数
[0040][0041]其中,λ1和λ2均为超参数,Θ为L2正则化项。
[0042]在一个实施例中,超参数λ1=0.01或者λ1=0.05,温度超参数τ=0.50或者τ=0.05。
[0043]在一个实施例中,随机删除比率ρ=0.1或者ρ=0.3。
[0044]第二方面,提供一种对比学习增强的协同知识图谱推荐方法,包括:
[0045]确定协同知识图谱;协同知识图谱中的节点包括用户节点、项目节点和实体节点;
[0046]将协同知识图谱输入到对比学习增强的协同知识图谱推荐模型,得到每个用户节点的第一表征和第二表征,以及每个项目节点的第一表征和第二表征;
[0047]选取每个用户节点的第一表征或者第二表征,作为每个用户节点的表征;
[0048]选取每个项目节点的第一表征或者第二表征,作为每个项目节点的表征;
[0049]针对每个用户节点,计算用户节点的表征与每个项目节点的表征的相似度,将最大相似度对应的项目节点推荐给用户节点;
[0050]协同知识图谱推荐模型为根据权利要求1

7中任意一项权利要求的对比学习增强的协同知识图谱推荐模型构建方法得到的。
[0051]第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对比学习增强的协同知识图谱推荐模型构建方法,其特征在于,包括:获取协同知识图谱训练集;所述协同知识图谱训练集包括多个协同知识图谱;所述协同知识图谱中的节点包括用户节点、项目节点和实体节点;将每个协同知识图谱输入到数据增强模块进行数据增强,得到第一子视图和第二子视图;将所述第一子视图和所述第二子视图输入到节点表征提取模块,分别对所述第一子视图和所述第二子视图进行节点表征提取,分别得到每个节点的第一表征和每个节点的第二表征;对所述每个节点的第一表征挖掘相关特征,得到所述每个节点的第三表征,以及对所述每个节点的第二表征挖掘相关特征,得到所述每个节点的第四表征;基于所述每个节点的第三表征和所述每个节点的第四表征,构建损失函数;基于所述损失函数对所述数据增强模块和所述节点表征提取模块进行训练,得到训练后的数据增强模块和训练后的节点表征提取模块,所述训练后的数据增强模块和训练后的节点表征提取模块构成所述对比学习增强的协同知识图谱推荐模型。2.如权利要求1所述的方法,其特征在于,其中,将每个协同知识图谱输入到数据增强模块进行数据增强,得到第一子视图和第二子视图,包括:按照随机删除比率ρ分别生成用于删除边的第一向量和第二向量;所述第一向量作用于所述协同知识图谱,得到第一子视图;所述第二向量作用于所述协同知识图谱,得到第二子视图。3.如权利要求1所述的方法,其特征在于,所述节点表征提取模块包括第一GNN模块和第二GNN模块,所述第一GNN模块用于对所述第一子视图进行节点表征提取,得到所述每个节点的第一表征;所述第二GNN模块用于对所述第二子视图进行节点表征提取,得到所述每个节点的第二表征。4.如权利权利要求1所述的方法,其特征在于,其中,对所述每个节点的第一表征挖掘相关特征,得到所述每个节点的第三表征,采用以下公式:其中,Z

x
为每个节点的第三表征,σ为激活函数,W2和W1均为第一多层感知机的训练参数,为每个节点的第一表征,b1和b2均为偏差参数;对所述每个节点的第二表征挖掘相关特征,得到所述每个节点的第四表征,采用以下公式:其中,Z”x
为每个节点的第四表征,σ为激活函数,Q2和Q1均为第二多层感知机的训练参数,为每个节点的第二表征,b1和b2均为偏差参数。5.如权利权利要求1所述的方法,其特征在于,其中,基于所述每个节点的第三表征和所述每个节点的第四表征,构建损失函数,包括:构建用户侧损失函数
其中,U为用户节点集合,u≠v,s为余弦函数,Z

u
为用户节点u的第三表征,Z”u
为用户节点u的第四表征,τ为温度超参数,...

【专利技术属性】
技术研发人员:李晓慧李书琴
申请(专利权)人:西北农林科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1