一种知识增强的推荐方法和系统技术方案

技术编号:29401448 阅读:11 留言:0更新日期:2021-07-23 22:38
本发明专利技术公开了一种知识增强的推荐方法和系统。该方法包括:针对评论文档,提取全局层次的语义向量表示和语句层次的隐含向量表示,获得层次化的语义表示;利用知识库,检索与评论文档关联的语义知识,形成关联语义知识表示;融合所述层次化语义知识和所述关联语义知识表示,得到用户的语义知识增强表示、物品的语义知识增强表示以及用户‑物品交互的语义知识增强表示;基于神经协同过滤框架,融合所得到的用户的语义知识增强表示、物品的语义知识增强表示以及用户‑物品交互的语义知识增强表示,利用层次化的用户‑物品交互机制预测交互评分,以生成物品推荐结果。本发明专利技术层次化地模拟用户‑物品交互实现推荐预测,提供高质量的推荐结果。

【技术实现步骤摘要】
一种知识增强的推荐方法和系统
本专利技术涉及计算机
,更具体地,涉及一种知识增强的推荐方法和系统。
技术介绍
随着互联网和信息技术的发展,信息爆炸的问题越来越严峻,导致有用的信息被淹没在日益膨胀的信息流中。针对信息爆炸或信息过益的问题,推荐系统起到至关重要的作用,是解决信息过益的有效工具。推荐系统利用用户、物品的历史数据和各种类型的其他知识,根据用户所处的环境和需求采用不同的推荐方法为用户推荐新物品。推荐系统具有非常广泛的应用价值,在电子商务平台如Amazon、淘宝等扮演着非常重要的角色,在多媒体平台如Nextfix、Youtube、腾讯视频等提供给用户不可或缺的推荐服务。传统的推荐方法通常包括基于内容的推荐方法和协同过滤方法。基于内容的推荐方法依赖可能的内容信息,例如用户的个人信息或推荐物品的描述内容信息等,来估计用户的行为模式并进行相关的推荐。协同过滤方法是通过分析大众的行为模式,利用兴趣相似或拥有相同经验的群体喜好来近似目标用户的兴趣。协同过滤包括基于存储的方法和基于模型的方法等。基于存储的方法是利用用户的历史行为数据,计算相似度或相关性而进行推荐,例如基于用户的协同过滤算法。基于模型的方法是设计机器学习的模型挖掘用户行为中的行为模式来进行推荐,经典的方法包括矩阵分解(Matrixfactorization)、概率矩阵分解(ProbabilisticMatrixFactorization)等。近年来,基于深度学习的推荐方法引起了学术界和工业界的广泛兴趣。例如,一项研究成果利用深度学习模型自编码器来学习用户或物品的特征表示,然后用协同过滤来学习和挖掘用户的行为模式。一项研究成果提出了一种可以融合协同过滤和半监督学习的深度神经网络结构,协同过滤和半监督学习联合训练实现推荐预测。另一项研究成果针对Top-N(前N个)物品推荐任务,提出神经协同推荐算法实现用户行为交互评分预测。然而,传统的推荐方法主要是利用协同过滤的思想对个人喜好进行预测,无法准确地表示用户偏好,同时由于用户显示交互数据少,数据稀疏,导致推荐性能较低。而基于深度学习的推荐方法可以提取深层信息特征形成高层次的抽象表示,但是严峻的数据稀疏问题仍然影响推荐算法的性能,无法生成高质量的推荐结果。
技术实现思路
本专利技术的目的是克服上述现有技术的缺陷,提供一种知识增强的推荐方法和系统,利用外部知识库在用户、物品、用户-物品交互三方面进行知识增强,学习用户行为的知识增强表征,缓解数据稀疏的影响,解决冷启动问题。根据本专利技术的第一方面,提供一种知识增强的推荐方法。该方法包括以下步骤:步骤S1:针对评论文档,提取全局层次的语义向量表示和语句层次的隐含向量表示,获得层次化的语义表示;步骤S2:利用知识库,检索与评论文档关联的语义知识,形成关联语义知识表示;步骤S3:融合所述层次化语义知识和所述关联语义知识表示,得到用户的语义知识增强表示、物品的语义知识增强表示以及用户-物品交互的语义知识增强表示;步骤S4:基于神经协同过滤框架,融合所得到的用户的语义知识增强表示、物品的语义知识增强表示以及用户-物品交互的语义知识增强表示,利用层次化的用户-物品交互机制预测交互评分,以生成物品推荐结果。根据本专利技术的第二方面,提供一种知识增强的推荐系统。该系统包括:层次化语义提取单元:用于针对评论文档,提取全局层次的语义向量表示和语句层次的隐含向量表示,获得层次化的语义表示;关联语义提取单元:用于利用知识库,检索与评论文档关联的语义知识,形成关联语义知识表示;知识增强表示单元:用于融合所述层次化语义知识和所述关联语义知识表示,得到用户的语义知识增强表示、物品的语义知识增强表示以及用户-物品交互的语义知识增强表示;推荐预测单元:用于基于神经协同过滤框架,融合所得到的用户的语义知识增强表示、物品的语义知识增强表示以及用户-物品交互的语义知识增强表示,利用层次化的用户-物品交互机制预测交互评分,以生成物品推荐结果。与现有技术相比,本专利技术的优点在于,针对推荐系统中严峻的数据稀疏问题,采用外部知识在用户、物品、用户-物品交互三方面进行语义知识增强,设计层次化的知识增强用户行为表征学习方法,获得高质量的特征表示,准确刻画用户行为偏好,解决数据稀疏和冷启动问题;基于神经协同过滤框架,融合知识增强的用户行为表征,提出层次化的神经网络推荐算法,层次化地模拟用户-物品交互实现推荐预测,提供高质量的推荐结果,提升推荐性能。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。图1是根据本专利技术一个实施例的知识增强的推荐方法的流程图;图2是根据本专利技术一个实施例的语义知识增强的框架图;图3是根据本专利技术一个实施例的层次化神经网络推荐算法的示意图。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。在下文的描述中,设数据集中具有m个用户,记为u;n个物品,记为v。用户与物品的交互行为表示为<ui,vj,rij,dij>,其中rij表示用户ui对物品vj的评分,dij表示用户ui对物品vj的文本评论,用户-物品交互矩阵标记为R,文本评论集合标记为D,所有文本评论构成的词典为Vg,常识知识库为KB。本文要解决的问题可定义为:给定用户集合U,物品集合V,用户-物品交互矩阵R和文本评论集合D,常识知识库KG,对于给定的用户u,推荐top-N个物品(该用户未交互过的物品)。简言之,本专利技术提供的知识增强的推荐方法主要包括两部分,分别是知识增强的用户行为表征学习和层次化的神经网络推荐算法,具体结合图1所示,该方法包括以下步骤。步骤S110,学习知识增强的用户行为表征,获得用户的知识增强表示、物品的知识增强表示以及用户-物品交互的知识增强表示。例如,对于每个用户/物品,利用池化的方法将某用户/物品的所有评论文档整合成为一个用户/物品语义文档du(dv);并对新构建的用户语义文档、物品语义文档和原有的用户-物品评论文档,提取语义知识,如图2所示,语义知识增强过程本文档来自技高网
...

【技术保护点】
1.一种知识增强的推荐方法,包括以下步骤:/n步骤S1:针对评论文档,提取全局层次的语义向量表示和语句层次的隐含向量表示,获得层次化的语义表示;/n步骤S2:利用知识库,检索与评论文档关联的语义知识,形成关联语义知识表示;/n步骤S3:融合所述层次化语义知识和所述关联语义知识表示,得到用户的语义知识增强表示、物品的语义知识增强表示以及用户-物品交互的语义知识增强表示;/n步骤S4:基于神经协同过滤框架,融合所得到的用户的语义知识增强表示、物品的语义知识增强表示以及用户-物品交互的语义知识增强表示,利用层次化的用户-物品交互机制预测交互评分,以生成物品推荐结果。/n

【技术特征摘要】
1.一种知识增强的推荐方法,包括以下步骤:
步骤S1:针对评论文档,提取全局层次的语义向量表示和语句层次的隐含向量表示,获得层次化的语义表示;
步骤S2:利用知识库,检索与评论文档关联的语义知识,形成关联语义知识表示;
步骤S3:融合所述层次化语义知识和所述关联语义知识表示,得到用户的语义知识增强表示、物品的语义知识增强表示以及用户-物品交互的语义知识增强表示;
步骤S4:基于神经协同过滤框架,融合所得到的用户的语义知识增强表示、物品的语义知识增强表示以及用户-物品交互的语义知识增强表示,利用层次化的用户-物品交互机制预测交互评分,以生成物品推荐结果。


2.根据权利要求1所述的知识增强的推荐方法,其特征在于,在步骤S1中,根据以下子步骤获得所述层次化的语义表示:
针对评论文档,构建词向量,并利用第一循环神经网络提取全局层次的语义隐含向量Sg,该全局层次的语义向量Sg包含全局的潜在语义信息;
以所构建的词向量为输入,应用第二循环神经网络提取语句层次的语义隐含向量表示Ss,该语句层次的隐含向量表示Ss包含细粒度的上下文信息的语义知识表示;
融合全局层次的语义隐含向量Sg和语句层次的隐含向量表示Ss,得到层次化的语义表示C=[Sg,Ss]。


3.根据权利要求2所述的知识增强的推荐方法,其特征在于,在步骤S2中,根据以下子步骤形成所述关联语义知识表示:
针对评论文档中的词,从知识库检索top-N相关概念,概念的向量表示;
对于每个词wi,利用注意力机制计算检索到的概念知识的关联影响βij=Attention(wi,cj),并计算增强概念表示其中cj是检索到的概念的向量表示,j是索引;
以所述概念知识的关联影响为输入,应用第三循环神经网络得到关联语义知识表示CA;
利用全局层次的语义向量表示Sg和关联语义知识表示CA构成增强语义键-值对,其中键为Sg,对应的值为CA;
采用多头注意力机制融合层次化的语义表示C和增强语义键-值对,得到深层次语义知识表示


4.根据权利要求3所述的知识增强的推荐方法,其特征在于,步骤S3包括:
对于用户和物品,采用独热编码表示所用用户和物品,并将独热编码映射成稠密空间的用户浅层表示u和物品浅层表示v;
通过串联操作得到用户的语义知识增强表示物品的语义知识增强表示以及用户-物...

【专利技术属性】
技术研发人员:吕子钰乔宇
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1