一种基于知识图谱的推荐方法及系统技术方案

技术编号:26791020 阅读:39 留言:0更新日期:2020-12-22 17:06
本发明专利技术公开了一种基于知识图谱的推荐方法。其技术方案包括:通过对用户和实体的自身的原始特征进行特征整合,得到用户特征编码和实体特征编码;根据用户与实体之间的关系构成知识图谱,从知识图谱中获取用户与实体之间的路径,并根据用户与实体之间的关系进行编码,经过融合处理,得到用户对该实体所有路径的综合路径编码;根据用户特征编码、实体特征编码和综合路径编码,计算用户与实体产生交互的可能性参数;根据所述可能性参数进行实体推荐。本发明专利技术直接根据知识图谱中实体和实体之间的关系以及用户的交互行为获取用户与实体之间的路径,同时,可以计算用户与实体之间不存在路径情况下的交互的可能性参数。

【技术实现步骤摘要】
一种基于知识图谱的推荐方法及系统
本专利技术涉及互联网信息推荐
,尤其涉及一种基于知识图谱的推荐方法及系统。
技术介绍
近年来,知识图谱因其包含丰富的实体及关系引起了推荐系统领域研究者们的广泛兴趣,它可以将用户与实体之间的交互行为转换为三元组形式。并且,通过图谱内用户与实体、实体与实体之间的连接关系,反映用户与实体之间的潜在关系,是对传统用户-实体交互数据的补充。目前,基于知识图谱的推荐技术主要可以分为两大类,第一类是基于元路径的推荐,第二类是基于embedding的推荐。基于元路径的推荐缺点:因为元路径通常不考虑关系,所以无法指定路径的整体语义,尤其是元路径中实体相似而关系不同的时候;因为元路径需要预定义领域知识,所以无法自动发现并根据没见过的模式进行推理。基于embedding的推荐缺点:基于embedding仅考虑实体之间的直接联系,而不考虑如元路径中的多条连接,缺乏推理能力;以一种隐含的方式实现用户-实体的关联表征,不是直接的用户兴趣推荐。因此,本专利技术主要提出了一种融合用户特征、实体特征和用户与实体交互行为路径的基于知识图谱的推荐方法。
技术实现思路
本申请实施例提供了一种基于知识图谱的推荐方法及系统,以至少解决相关技术中不考虑用户与实体的关系的问题。第一方面,本申请实施例提供了一种基于知识图谱的推荐方法,包括以下步骤:步骤1:通过对用户和实体的自身的原始特征进行特征整合,得到用户特征编码和实体特征编码;步骤2:根据用户与实体之间的关系构成知识图谱,从所述知识图谱中获取用户与实体之间的路径,并根据用户与实体之间的关系进行编码,经过融合处理,得到用户对该实体所有路径的综合路径编码;步骤3:根据所述用户特征编码、所述实体特征编码和所述综合路径编码,计算用户与实体产生交互的可能性参数;步骤4:根据所述可能性参数进行实体推荐。在其中一些实施例中,用户和实体均具有稀疏特征和稠密特征,所述步骤1包括:根据用户和实体自身的稀疏特征或稠密特征,利用embedding进行特征整合,将用户和实体参数化为矢量表示,得到所述用户特征编码和所述实体特征编码。在其中一些实施例中,所述特征整合的具体步骤包括:将稀疏特征转换为多维的稠密向量,并将稠密特征处理为正态分布,得到用户和实体的各特征的embedding向量,从而得到所述用户特征编码和所述实体特征编码。在其中一些实施例中,所述步骤2具体包括以下步骤:首先根据所述知识图谱中实体、实体之间的关系以及用户的交互行为选取用户与实体之间的一条路径,对用户、实体及用户和实体之间的关系进行编码,并将编码结果输入RNN模型,得到该路径的编码结果;将用户与实体之间的所有路径的进行上述编码,经过融合处理,得到用户对该实体所有路径的所述综合编码表示。在其中一些实施例中,所述步骤3包括:将所述用户特征编码、所述实体特征编码和所述综合路径编码拼接成整体编码,利用多层感知机进行特征交互,计算用户与实体产生交互的可能性参数。在其中一些实施例中,所述步骤3具体包括:将所述用户特征编码、所述实体特征编码和所述综合路径编码拼接成整体编码,所述多层感知机有两个全连接层,将所述整体编码输入至所述多层感应机的输入层,得到预测分数:其中,e为整体编码,W1T和是第一层和第二层的权重参数,b1和b2是第一层和第二层的偏执参数,σ(.)是sigmoid函数,ReLU(.)为线性整流函数,将所述预测分数映射到[0,1]范围内,计算用户与实体产生交互的可能性参数。第二方面,本申请实施例提供了一种基于知识图谱的推荐系统,应用于上述的一种基于知识图谱的推荐方法,包括:特征编码模块,通过对用户和实体的自身的原始特征进行特征整合,得到用户特征编码和实体特征编码;路径编码模块,根据用户与实体之间的关系构成知识图谱,从所述知识图谱中获取用户与实体之间的路径,根据用户与实体之间的关系进行编码,将编码结果送入模型,并输出路径编码;路径综合模块,接收所述路径编码模块输出的所述路径编码,经过处理,输出用户与该实体所有路径的综合编码表示;预测模块,接收所述特征编码模块的所述用户特征编码和所述实体特征编码,所述路径综合模块输出的所述综合编码编码表示,计算用户与实体产生交互的可能性参数。在其中一些实施例中,所述特征编码模块根据用户和实体自身的稀疏特征或稠密特征,利用embedding进行特征整合,将稀疏特征转换为多维的稠密向量,并将稠密特征处理为正态分布,得到用户和实体的各特征的embedding,将用户和实体参数化为矢量表示,得到所述用户特征编码和所述实体特征编码。在其中一些实施例中,所述路径编码模块根据所述知识图谱中实体、实体之间的关系以及用户的交互行为选取用户与实体之间的一条路径,对用户、实体及用户和实体之间的关系进行编码,并将编码结果输入RNN模型,输出该路径的编码结果至所述路径综合模块,所述路径综合模块接收用户与实体之间所有路径的编码结果,经过融合处理,得到用户对该实体所有路径的所述综合编码表示。在其中一些实施例中,所述预测模块包括多层感知机,所述多层感知机有两个全连接层,所述预测模块将所述用户特征编码、所述实体特征编码和所述综合路径编码拼接成整体编码,将所述整体编码输入至所述多层感知机的输入层,得到预测分数:其中,e为整体编码,W1T和是第一层和第二层的权重参数,b1和b2是第一层和第二层的偏执参数,σ(.)是sigmoid函数,ReLU(.)为线性整流函数,并将所述预测分数映射到[0,1]范围内,得到用户与实体产生交互的可能性参数。相比于相关技术,本申请实施例提供的一种基于知识图谱的推荐方法及系统,具有以下优点:1)本专利技术不需要领域专家指定元路径,可以直接根据知识图谱中实体、实体之间的关系以及用户交互行为获取用户与实体之间的路径。2)本专利技术可以计算用户和与用户不存在路径的实体之间的交互的可能性参数,此时仅有用户特征向量和实体特征向量,只要将路径表示为全0向量即可计算用户与实体之间交互的可能性参数。3)本专利技术与基于embedding的推荐方法相比,可解释性强。本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是本申请中实施例提出的一种基于知识图谱的推荐方法的流程图;图2是本申请中实施例提出的一种基于知识图谱的推荐方法的流程示意图;图3是本申请中实施例提出的推荐事例的知识图谱;图4是本申请中实施例提出的用户特征编码示意图;图5是本申请中实施例提出的路径编码示意图;图6是本申请中本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的实体推荐方法,其特征在于,包括以下步骤:/n步骤1:通过对用户和实体的自身的原始特征进行特征整合,得到用户特征编码和实体特征编码;/n步骤2:根据用户与实体之间的关系构成知识图谱,从所述知识图谱中获取用户与实体之间的路径,并根据用户与实体之间的关系进行编码,经过融合处理,得到用户对该实体所有路径的综合路径编码;/n步骤3:根据所述用户特征编码、所述实体特征编码和所述综合路径编码,计算用户与实体产生交互的可能性参数;/n步骤4:根据所述可能性参数进行实体推荐。/n

【技术特征摘要】
1.一种基于知识图谱的实体推荐方法,其特征在于,包括以下步骤:
步骤1:通过对用户和实体的自身的原始特征进行特征整合,得到用户特征编码和实体特征编码;
步骤2:根据用户与实体之间的关系构成知识图谱,从所述知识图谱中获取用户与实体之间的路径,并根据用户与实体之间的关系进行编码,经过融合处理,得到用户对该实体所有路径的综合路径编码;
步骤3:根据所述用户特征编码、所述实体特征编码和所述综合路径编码,计算用户与实体产生交互的可能性参数;
步骤4:根据所述可能性参数进行实体推荐。


2.根据权利要求1所述的一种基于知识图谱的推荐方法,用户和实体均具有稀疏特征和稠密特征,其特征在于,所述步骤1包括:
根据用户和实体自身的稀疏特征或稠密特征,利用embedding进行特征整合,将用户和实体参数化为矢量表示,得到所述用户特征编码和所述实体特征编码。


3.根据权利要求2所述的一种基于知识图谱的推荐方法,其特征在于,所述特征整合的具体步骤包括:将稀疏特征转换为多维的稠密向量,并将稠密特征处理为正态分布,得到用户和实体的各特征的embedding向量,从而得到所述用户特征编码和所述实体特征编码。


4.根据权利要求1所述的一种基于知识图谱的推荐方法,其特征在于,所述步骤2具体包括以下步骤:
首先根据所述知识图谱中实体、实体之间的关系以及用户的交互行为选取用户与实体之间的一条路径,对用户、实体及用户和实体之间的关系进行编码,并将编码结果输入RNN模型,得到该路径的编码结果;
将用户与实体之间的所有路径的进行上述编码,经过融合处理,得到用户对该实体所有路径的所述综合编码表示。


5.根据权利要求1所述的一种基于知识图谱的推荐方法,其特征在于,所述步骤3包括:
将所述用户特征编码、所述实体特征编码和所述综合路径编码拼接成整体编码,利用多层感知机进行特征交互,计算用户与实体产生交互的可能性参数。


6.根据权利要求5所述的一种基于知识图谱的推荐方法,其特征在于,所述步骤3具体包括:将所述用户特征编码、所述实体特征编码和所述综合路径编码拼接成整体编码,所述多层感知机有两个全连接层,将所述整体编码输入至所述多层感应机的输入层,得到预测分数:



其中,e为整体编码,和是第一层和第二层的权重参数,b1和b2是第一层和第二层的偏执参数,σ(.)是sigm...

【专利技术属性】
技术研发人员:江丹丹郑悦景艳山
申请(专利权)人:北京明略昭辉科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1