一种面向知识感知推荐的知识图谱构建方法技术

技术编号:34602057 阅读:21 留言:0更新日期:2022-08-20 09:05
本发明专利技术公开了一种面向知识感知推荐的知识图谱构建方法,本发明专利技术利用开源知识库链接数据集KB4Rec,将推荐数据集中的项目与开放领域知识图谱中的实体进行链接,并根据映射关系从开放领域知识图谱中迭代抽取三元组,经过实体筛选、关系筛选等处理,构建一个面向知识感知推荐的联系增强的知识图谱。本发明专利技术解决了通用的知识图谱构建方法工作量大、私人知识库无法获取的问题,使推荐系统能够利用大型开源知识图谱中的知识来提升推荐效果。本发明专利技术通过人工筛选关系类型、过滤低频实体以及交互密度控制等手段,解决了知识图谱关系质量差、三元组不够丰富、推荐数据的交互密度低等问题,保证了知识图谱中的项目属性与用户交互信息的质量。知识图谱中的项目属性与用户交互信息的质量。知识图谱中的项目属性与用户交互信息的质量。

【技术实现步骤摘要】
一种面向知识感知推荐的知识图谱构建方法


[0001]本申请涉及计算机
,尤其涉及一种面向知识感知推荐的知识图谱构建方法。

技术介绍

[0002]近几十年,随着互联网的快速发展,互联网上的数据成倍增长,过大的信息量引起信息超载问题,用户很难从海量数据中轻松挑选出他们感兴趣的内容。为了解决信息超载问题,改善用户体验,推荐系统已被应用于各种在线应用的场景,如:音乐推荐、电影推荐、新闻推荐、在线购物等。可以说,几乎所有提供内容的互联网服务都涉及到推荐系统的应用。
[0003]推荐算法是推荐系统的核心部分,根据推荐算法原理的不同,推荐系统主要分为三种:基于协同过滤的推荐系统、基于内容的推荐系统和混合型推荐系统。
[0004]1)基于协同过滤的推荐系统:主要利用交互数据中的用户或项目的相似性对用户偏好进行建模。
[0005]2)基于内容的推荐系统:通过内容分析抽取项目的特征用于计算相似度。
[0006]其中,基于协同过滤的推荐系统由于不需要人工提取特征,因而获得广泛应用。
[0007]尽管协同过滤算法在实际应用与学术研究领域都取得了诸多成果,但仍然面临一些挑战,如:数据稀疏性、冷启动问题。为了解决这些问题,混合型推荐系统被提出,它在协同过滤的基础上引入“边信息”,从而同时利用交互层与内容层的相似性,结合以上两种推荐系统的优势。近年来,混合型推荐系统已经探索了多种类型的边信息,如:项目属性、项目评论以及用户的社交网络等。
[0008]随着知识图谱在信息检索、知识问答、人工智能等多个领域的广泛应用,将知识图谱作为边信息引入推荐系统的方法逐渐成为研究热点。这种方法不仅可以缓解上述诸多问题,提升推荐系统的准确性,还可以为推荐的项目提供推荐解释,实现可解释推荐服务,增强用户对推荐结果的认可度。这类利用知识图谱中的信息进行用户偏好建模的混合型推荐系统,被称为知识感知推荐系统。
[0009]知识感知推荐系统需要深入挖掘、利用知识图谱中的项目相关信息来建模用户偏好,知识图谱本身的质量很大程度上决定了推荐系统的推荐性能。因此,在知识感知推荐系统的实现过程中,一个关键的问题就是数据问题,即如何获取丰富的、结构化的项目相关知识信息构建一个高质量的知识图谱。根据数据来源的不同,现有的知识感知推荐系统使用的知识图谱主要通过三种途径构建:一是使用原始推荐数据集中的边信息(通常仅包含少量有用信息);二是使用非开源的私人知识库,如微软的Satori;三是利用推荐服务平台的非公开项目数据。经过广泛调研,目前尚未发现一种面向知识感知推荐的通用的知识图谱构建方法。
[0010]现有技术一的技术方案
[0011]与本专利技术相关的现有技术一即知识图谱。知识图谱是一种异构信息网络,其中的
节点可以表示实体,边可以表示实体之间的关系。在用于推荐系统的知识图谱中,通常将项目及其相关属性作为实体,通过属性关系的连通性可以揭示不同项目之间的相互关系及高级语义关系。此外,一些研究者还将用户与用户的相关信息整合到知识图谱中,这种知识图谱可以直接探索用户与物品之间的关系,以捕获用户的偏好,被称为协同知识图谱(Collaborative Knowledge Graph)。
[0012]推荐系统中常用的知识图谱定义如下:
[0013]G={(h,r,t)|h,t∈E,r∈R}
[0014]其中,E和R分别表示知识图谱中的实体集和关系集,三元组(h,r,t)则表示头实体h与尾实体t之间存在着一种关系r。例如,在电影推荐领域,三元组(Leonardo DiCaprio,ActorOf,The Great Gatsby)表示一个事实:Leonardo是电影《The Great Gatsby》的一名演员。显然,这条信息对于向Leonardo的粉丝推荐这部电影可以起到决定性作用。
[0015]协同知识图谱的定义与上述定义相似,只是在原有知识图谱中加入了用户实体和用户

项目之间的交互关系,从而将用户行为与项目知识整合在同一知识图谱中,其定义如下:
[0016]G={(h,r,t)|h,t∈E

,r∈R

},E

=E∪U,R

=R∪{Interact}
[0017]其中U表示用户实体集,E表示其他类型实体集(项目及项目属性);R表示项目关系,Interact表示用户

项目实体之间的交互关系。图1展示了一个电影推荐领域的协同知识图谱实例,最左侧的watched关系即用户

项目交互关系。通过该知识图谱中的用户社交信息与项目属性信息,推荐系统可以为目标用户Bob推荐图中右侧的两部电影。
[0018]现有技术一的缺点
[0019]目前一些推荐系统所使用的知识图谱包含的知识还不够丰富,实体的平均三元组密度较低、关系类型较少,且关系质量差,如:存在双向同义关系、不相关甚至无语义的关系。显然,这类关系及其相关三元组对于推荐系统的推荐决策过程是无效的,大量的无效信息在知识图谱中引入噪声,将严重干扰推荐系统对用户偏好的建模,降低推荐系统的准确性。
[0020]与本专利技术相关的现有技术二
[0021]现有技术二的技术方案
[0022]现有的用于推荐系统的知识图谱构建方法主要可以分为两类:
[0023]1)利用原始推荐服务平台或者推荐数据集的项目相关数据来收集边信息,构建针对该推荐场景的小型结构化知识库,最后再根据实验数据集构建知识图谱。
[0024]2)将推荐数据集与私人知识库建立链接,迭代抽取三元组构建知识图谱。
[0025]第一类方法属于构建知识图谱的通用方法,并不仅针对推荐系统。该方法的主要工作流程包括:信息抽取、知识抽取、知识融合、知识加工等。其中,信息抽取是一种从半结构化或无非结构化数据中抽取实体、关系以及实体属性等结构化信息的技术,也是知识图谱构建的第一步。知识抽取是将抽取到的信息转化为结构化知识的形式,如RDF数据。知识融合包括实体链接、知识合并,它将以上步骤获得实体、关系及实体属性整合在同一个知识库中,消除歧义,获得一系列基本事实,从而实现对实体的完善描述。知识加工是指在知识融合的基础上,对事实做进一步加工,使之成为结构化、网络化的知识,这部分工作包括:本体构建、知识推理以及质量评估等。
[0026]第二类方法基于已有的知识库构建知识图谱,本质上是一个知识抽取的过程,因此,相较于第一类方法更为简单快捷,工作量小。以经典的知识感知推荐模型RippleNet为例,它利用微软的Satori知识库构建了三个不同推荐领域的知识图谱,具体流程如下:
[0027]1)针对不同的推荐领域,从整个知识库中抽取关系名称包含特定领域关键词的三元组,例如,对于电影数据集MovieLens

1M则抽取包含“电影”的关系名称。筛选置信度大于0.9的三元组,构成三元组子集。
[0028]2)在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向知识感知推荐的知识图谱构建方法,其特征在于包括以下步骤:步骤1),通过推荐数据集获取用户交互数据;步骤2),从步骤1)中的原始推荐数据集采样获得子数据集,再经过以下三个步骤获得用于构建知识图谱的二元评分数据集:步骤2.1),K

core提取:仅保留交互记录大于K的用户及项目;步骤2.2),交互密度控制:使交互密度在人为控制的范围内;步骤2.3),评分二元化:通过人为设置评分阈值的方式将原始数据二元化,若原始评分大于等于阈值,则二元评分为1,否则为0;步骤3),由二元评分数据集中提取出项目集;步骤4),利用开源知识库链接数据集KB4Rec,将推荐数据集中的项目与开放领域知识图谱中的实体进行链接,实现项目

实体之间的映射;步骤5),根据步骤4)得出的映射关系从开放领域知识图谱Freebase中,以项目实体作为初始种子集迭代地抽取三元组;步骤6),经过人工筛选有效关系、低频实体过滤处理,构建了一个面向知识感知推荐的联系增强的知识图谱。2.根据权利要求1所述的一种面向知识感知推荐的知识图谱构建方法,其特征在于,所述的...

【专利技术属性】
技术研发人员:吴岳辛范春晓张建明秦爽
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1