一种基于知识图谱嵌入的协同过滤推荐方法技术

技术编号:33960542 阅读:10 留言:0更新日期:2022-06-30 00:26
本发明专利技术公开了一种基于知识图谱嵌入的协同过滤推荐方法,包括:步骤1,在结构化知识特征提取阶段,基于用户

【技术实现步骤摘要】
一种基于知识图谱嵌入的协同过滤推荐方法


[0001]本专利技术属于计算机应用领域,具体涉及一种基于知识图谱嵌入的协同过滤推荐方法。

技术介绍

[0002]近年来,随着购物、新闻、阅读、音乐、视频平台和社交媒体网站等网络应用的快速发展,用户不得不从铺天盖地的信息中选择自己喜欢的内容。在这种情况下,推荐系统作为一种缓解信息过载的工具,需要帮助用户从不断增长的海量数据中发掘个性化的兴趣。
[0003]为了实现个性化推荐,传统的协同过滤方法利用各种用户在线的非结构化数据,如点击、评分等,并根据这些历史信息,预测用户对项目的偏好。一般而言,可学习的协同过滤模型由嵌入和交互数据建模两个部分组成。其中,嵌入是将用户和项目转换为向量形式,而交互数据建模则是基于嵌入的向量来重构用户、项目的历史交互信息。
[0004]例如,矩阵分解模型直接将用户和项目的ID表示为向量形式,并通过内积的方式对他们的交互进行建模;神经协同过滤模型使用非线性神经网络代替矩阵分解模型中的内积交互函数;基于翻译的协同过滤模型使用欧几里德距离度量作为预测推荐结果的交互函数。然而这些方法因为仅考虑了用户、项目的ID或属性这类描述性特征来构建嵌入函数,可能会导致协同过滤算法难以产生令人满意的嵌入向量,并且当交互函数更深入地挖掘复杂的用户

项目关系时,这些方法还会趋于过度拟合,使稀疏性问题更加严重。因此,研究者提出在推荐系统中使用辅助信息来丰富项目的语义表示,如社交网络、属性和多媒体。
[0005]知识图谱作为一种含有丰富结构化语义知识的辅助信息,在提高推荐的准确性和可解释性方面表现出了巨大的潜力。知识图谱是一种机器可理解的并以图的形式存储现实世界中客观事实的异构信息网络,图中的节点表示实体,即现实世界中的相关概念、属性等,与之相连的边表示不同实体之间的关系。知识图谱通过不同类型的关系构建了项目之间的链接,从而捕获项目之间的语义相关性,扩充了项目的内在特征。与没有知识图谱辅助的推荐模型相比,使用知识图谱辅助的推荐模型可以让推荐结果更加准确和多样。
[0006]虽然知识图谱有着上述优点,但是开发基于知识图谱的推荐系统存在两个关键问题,第一是如何为推荐项目获取丰富的结构化知识信息,第二是如何发掘知识图谱定义的用户特定项目和图中实体之间的语义关联性。对于第一个问题,现有的研究一般有两种处理方法:a)通过搜集各种辅助信息来制作结构化的项目知识。该方法一般先从推荐系统平台上收集辅助信息作为上下文特征,然后再将其构建为少量而简单的类似于知识库的结构化信息。但这种知识库拥有的与项目相关的属性和关系数量通常很少,并且大部分有用的项目信息也可能会丢失。b)使用外部构建好的知识图谱来丰富项目的语义特征。

技术实现思路

[0007]本专利技术是为了解决上述问题而进行的,目的在于提供一种基于知识图谱嵌入的协同过滤推荐方法。
[0008]本专利技术提供了一种基于知识图谱嵌入的协同过滤推荐方法,具有这样的特征,包括以下步骤:步骤1,在结构化知识特征提取阶段,基于用户

项目历史交互和Satori知识图谱构建子知识图谱,然后通过改进的知识图嵌入方法从子知识图谱中寻找结构化知识的潜在向量表示,得到结构化嵌入向量,以此获得具有知识感知的项目表征;步骤2,在联合学习阶段,基于结构化嵌入向量和非结构化项目特征向量构建最终的项目潜在向量表征,并采用协同过滤的推荐方法,将结构化嵌入向量与非结构化项目特征向量的信息嵌入到统一的向量空间中;步骤3,在推荐列表生成阶段,使用用户向量表征和最终的项目潜在向量表征的内积作为用户的偏好概率值,并以用户的偏好概率值为目标生成个性化的推荐列表。
[0009]在本专利技术提供的基于知识图谱嵌入的协同过滤推荐方法中,还可以具有这样的特征:其中,步骤1中,以推荐系统中用户

项目历史交互和Satori知识图谱作为输入,提取与项目相关的实体来构建子知识图谱。
[0010]在本专利技术提供的基于知识图谱嵌入的协同过滤推荐方法中,还可以具有这样的特征:其中,步骤2中,将知识图谱中的结构化嵌入向量和非结构化项目特征向量以按元素位置相加的方式集成在一起,构建最终的项目潜在向量表征。
[0011]在本专利技术提供的基于知识图谱嵌入的协同过滤推荐方法中,还可以具有这样的特征:其中,步骤2中,协同过滤的推荐方法通过优化项目之间的成对排序函数,将结构化与非结构的信息嵌入到统一的向量空间中。
[0012]在本专利技术提供的基于知识图谱嵌入的协同过滤推荐方法中,还可以具有这样的特征,还包括:步骤4,检测阶段,在检测阶段,采集不同领域的数据,带入模型,进行个性化推荐,获得最优检测结果。
[0013]专利技术的作用与效果
[0014]根据本专利技术所涉及的基于知识图谱嵌入的协同过滤推荐方法,因为具体步骤为:步骤1,在结构化知识特征提取阶段,基于用户

项目历史交互和Satori知识图谱构建子知识图谱,然后通过改进的知识图嵌入方法从子知识图谱中寻找结构化知识的潜在向量表示,得到结构化嵌入向量,以此获得具有知识感知的项目表征;步骤2,在联合学习阶段,基于结构化嵌入向量和非结构化项目特征向量构建最终的项目潜在向量表征,并采用协同过滤的推荐方法,将结构化嵌入向量与非结构化项目特征向量的信息嵌入到统一的向量空间中;步骤3,在推荐列表生成阶段,使用用户向量表征和最终的项目潜在向量表征的内积作为用户的偏好概率值,并以用户的偏好概率值为目标生成个性化的推荐列表。
[0015]因此,本专利技术的基于知识图谱嵌入的协同过滤推荐方法将知识图谱的结构化信息整合到协同过滤框架中,使用改进的知识图嵌入算法从结构化数据中提取项目的语义特征,并在端到端的模型中联合学习用户、项目表征,有效缓解了稀疏性问题,提高了推荐的准确性。
[0016]此外,本专利技术的检测阶段中在两个真实数据集Movielens

1M与Last.FM上进行了实验,使用Precision、Recall、F1值和NDCG作为模型的评估指标,将KGECF与BPR、LINE、CFKG和KTUP进行对比,实验表明KGECF在两个数据集上的推荐准确率、召回率、F1值和NDCG四个指标上均优于对比算法,能够集成大规模的结构化和非结构化数据,同时获得高精度的推荐结果,能为用户提供更准确的推荐结果,在融合异构数据方面也具有较强的灵活性。
附图说明
[0017]图1是本专利技术实施例中基于知识图谱嵌入的协同过滤推荐方法的模型图;
[0018]图2是本专利技术实施例中基于知识图谱嵌入的协同过滤推荐方法的代码运行过程图。
具体实施方式
[0019]为了使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,以下实施例结合附图对本专利技术一种基于知识图谱嵌入的协同过滤推荐方法作具体阐述。
[0020]在本实施例中,提供了一种基于知识图谱嵌入的协同过滤推荐方法。
[0021]图1是本专利技术实施例中基于知识图谱嵌入的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱嵌入的协同过滤推荐方法,其特征在于,包括以下步骤:步骤1,在结构化知识特征提取阶段,基于用户

项目历史交互和Satori知识图谱构建子知识图谱,然后通过改进的知识图嵌入方法从所述子知识图谱中寻找结构化知识的潜在向量表示,得到结构化嵌入向量,以此获得具有知识感知的项目表征;步骤2,在联合学习阶段,基于所述结构化嵌入向量和非结构化项目特征向量构建最终的项目潜在向量表征,并采用协同过滤的推荐方法,将所述结构化嵌入向量与所述非结构化项目特征向量的信息嵌入到统一的向量空间中;步骤3,在推荐列表生成阶段,使用用户向量表征和所述最终的项目潜在向量表征的内积作为用户的偏好概率值,并以所述用户的偏好概率值为目标生成个性化的推荐列表。2.根据权利要求1所述的基于知识图谱嵌入的协同过滤推荐方法,其特征在于:其中,...

【专利技术属性】
技术研发人员:孙云芸李海明
申请(专利权)人:上海电力大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1