一种基于知识图谱的信息资源查询推荐方法和系统技术方案

技术编号：22000212 阅读：45 留言：0更新日期：2019-08-31 05:23

本发明专利技术提出了一种基于知识图谱的信息资源查询推荐方法和系统，该方法首先对知识图谱进行预处理，利用表示学习方法将知识图谱映射到低维稠密的向量空间中，得到实体的向量表示；然后根据用户的历史行为计算用户对信息资源的兴趣度，结合信息资源的向量化表示和用户对信息资源的兴趣度构建用户兴趣模型；通过计算资源与资源、用户与资源之间的相似度来实现信息资源的精准推荐。本发明专利技术将知识图谱表示学习与用户兴趣模型相结合来为用户提供个性化服务，兼顾知识的内在联系和用户兴趣，根据用户输入查询的资源名称，向用户推荐与查询内容相关并且符合用户兴趣的信息资源，使得个性化查询推荐更具专业性及针对性。

A Method and System of Information Resource Query and Recommendation Based on Knowledge Map

全部详细技术资料下载

【技术实现步骤摘要】
一种基于知识图谱的信息资源查询推荐方法和系统
本专利技术涉及知识图谱及推荐
，具体涉及一种基于知识图谱的信息资源查询推荐方法和系统。
技术介绍
近年来，信息技术的蓬勃发展带动了各行各业信息化的步伐，互联网、物联网、云计算等等逐渐融入人们的日常生活中，由此带来的是爆炸式增长的数据。庞大的信息资源库为用户提供了丰富的信息的同时也带来了资源过载的问题，这使用户在检选感兴趣的信息资源上耗费大量时间。而根据用户的历史行为数据进行个性化查询推荐，可以有效缓解资源过载的问题。推荐系统是当前应对信息过载的有效手段之一，它根据用户的历史行为分析用户的喜好，主动投其所好，例如用户在各种决策过程中购买哪种物品、阅读哪条新闻、听哪首音乐。协同过滤算法是最早提出的，同时也是研究与应用最多的一种推荐技术，它依赖于用户的行为，关注用户与项目的关联，主要分为两种不同算法，分别是基于用户的算法和基于项目的算法。基于用户的协同过滤基本原理就是寻找具有相似行为的用户，为用户推荐与其兴趣相投的用户所喜爱的资源；基于项目的协同过滤推荐旨在为用户推荐和他曾经感兴趣的项目具有相似性的项目，相似并非指项目内容的相似，而是利用用户对项目的评价或者行为，挖掘项目之间的相似度。但协同过滤算法过于依赖用户行为，导致当系统存在新用户或者新项目时，推荐将无从依据。除此之外，在实际生活中项目有上千万种，与用户产生交互的项目往往占少数，仅通过用户对项目的行为来挖掘相似项目会导致协同过滤算法的效果较差。针对这个问题，目前大多数研究的做法是引入辅助信息作为推荐算法的输入。而知识图谱包含了丰富的语义信息，旨在以结构化的...

【技术保护点】
1.一种基于知识图谱的信息资源查询推荐方法，其特征在于，所述方法包括以下步骤：(1)利用知识图谱表示学习方法将知识图谱映射至低维稠密的向量空间中，实现对知识图谱中的信息资源的向量化语义表示；(2)根据用户历史行为，计算用户对信息资源的兴趣度；(3)结合用户对信息资源的兴趣度与信息资源的向量化语义表示，构建用户兴趣模型；(4)根据用户查询的信息资源，计算该信息资源与其他信息资源的相似度，取相似度TOP‑M的信息资源形成候选资源集；(5)计算候选资源集中的信息资源与用户的相似度，从候选资源集中筛选出相似度TOP‑N的信息资源形成推荐列表。

【技术特征摘要】
1.一种基于知识图谱的信息资源查询推荐方法，其特征在于，所述方法包括以下步骤：(1)利用知识图谱表示学习方法将知识图谱映射至低维稠密的向量空间中，实现对知识图谱中的信息资源的向量化语义表示；(2)根据用户历史行为，计算用户对信息资源的兴趣度；(3)结合用户对信息资源的兴趣度与信息资源的向量化语义表示，构建用户兴趣模型；(4)根据用户查询的信息资源，计算该信息资源与其他信息资源的相似度，取相似度TOP-M的信息资源形成候选资源集；(5)计算候选资源集中的信息资源与用户的相似度，从候选资源集中筛选出相似度TOP-N的信息资源形成推荐列表。2.根据权利要求1所述的基于知识图谱的信息资源查询推荐方法，其特征在于，所述步骤1包括：(11)从知识图谱中选取指定数量的三元组(h，r，t)，称之为正例三元组，其中h、t分别代表头实体、尾实体，r表示两个实体间的关系；(12)利用负采样算法替换正例三元组的头实体或者尾实体，得到负例三元组；(13)利用表示学习模型迭代训练正例三元组和负例三元组至收敛，得到实体的向量表示Vi＝{v1，v2……，vm}，其中m表示维度。3.根据权利要求2所述的基于知识图谱的信息资源查询推荐方法，其特征在于，所述步骤12包括：(121)在关系r的所有三元组中，统计每个头实体相应的尾实体的平均个数，记为tph；统计每个尾实体相应的头实体的平均个数，记为hpt；(122)对于一个正例三元组(h，r，t)，抽取实体来替换头实体h和尾实体t，以p的概率替换头实体，以1-p的概率替换尾实体，生成负例三元组，其中替换概率p的计算公式为：4.根据权利要求2所述的基于知识图谱的信息资源查询推荐方法，其特征在于，所述步骤2包括：(21)收集包含用户行为的日志，包括用户浏览的资源名称、资源内容长度、浏览时长；(22)根据是否点击浏览、浏览时间、浏览速度建立多元线性方程，计算用户对资源的兴趣度。5.根据权利要求4所述的基于知识图谱的信息资源查询推荐方法，其特征在于，所述步骤22包括：(221)用户点击浏览某条信息资源i，记其点击兴趣度为...

【专利技术属性】
技术研发人员：冯钧，蒙琦，陆佳民，
申请(专利权)人：河海大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人