基于知识图谱的查询方法及装置制造方法及图纸

技术编号:33838788 阅读:24 留言:0更新日期:2022-06-16 12:00
本发明专利技术涉及知识图谱技术领域,公开了基于知识图谱的查询方法及装置,其中基于知识图谱的查询方法包括以下步骤:获得包括客体或概念的用户搜索信息;将用户搜索文信息划分为最小意义单位的关键词元素;根据各个关键词要素生成关键词数据对应组;关键词对应组根据预定的组合规则生成顺序对组合;将生成的顺序对组合映射到知识图谱中生成元组;为生成的元组的用户提供搜索结果;本发明专利技术的基于对于检索输入内容的处理映射以及匹配,使其符合知识图谱的知识结构,能够基于知识图谱得到更为匹配的内容,充分发挥知识图谱的知识结构的优越性。充分发挥知识图谱的知识结构的优越性。充分发挥知识图谱的知识结构的优越性。

【技术实现步骤摘要】
基于知识图谱的查询方法及装置


[0001]本专利技术涉及知识图谱
,更具体地说,它涉及基于知识图谱的查询方法及装置。

技术介绍

[0002]知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
[0003]知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论;知识图谱是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系。知识图谱通过对错综复杂的文档的数据进行有效的加工、处理、整合,转化为简单、清晰的“实体、关系、实体”的三元组,最后聚合大量知识,从而实现知识的快速响应和推理。
[0004]知识图谱的核心是从既有数据经过抽取、融合、分析加工,将结点属性数据抽象提取出标准的实体与关系,主要包括:信息抽取:从各种类型的数据源中提取出实体、属性以及实体间的相互关系,在此基础上形成本体化的知识表达;知识融合:在获得新知识之后,对其进行整合,以消除矛盾和歧义,如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等;知识加工:对于经过融合的新知识,经过质量评估之后(部分需要人工参与甄别),才能将合格的部分加入到知识库中,以确保知识库的质量;知识图谱虽然为智能化信息应用提供了基础,传统的基于关键词的简单的检索方法无法发挥知识图谱的知识结构的优越性。

技术实现思路

[0005]本专利技术提供一种基于知识图谱的查询方法,解决相关技术中基于关键词的简单的检索方法无法发挥知识图谱的知识结构的优越性的技术问题。
[0006]根据本专利技术的一个方面,提供了基于知识图谱的查询方法,包括以下步骤:步骤S11,获得包括客体或概念的用户搜索信息;步骤S12,将用户搜索文信息划分为最小意义单位的关键词元素;步骤S13,根据各个关键词要素生成关键词数据对应组;步骤S14,关键词对应组根据预定的组合规则生成顺序对组合;步骤S15,将生成的顺序对组合映射到知识图谱中生成元组;步骤S16,为生成的元组的用户提供搜索结果。
[0007]进一步地,所述关键词对应组根据预定的组合规则生成顺序对组合包括以下步
骤:步骤S21,按照一个关系的关键词要素加两个本体的关键词要素生成多个关键词数据对应组;步骤S22,提取上述关键词数据对应组中的一个,并将该关键词数据组与其他的关键词数据组对比,删除与其关键词要素完全重复的关键词数据组;步骤S23,提取下一个关键词数据对应组,并将该关键词数据组与其他的关键词数据组对比,删除与其关键词要素完全重复的关键词数据组;步骤S24,重复上一步骤,直至所有关键词数据对应组对比完毕。
[0008]进一步地,所述知识图谱是将从多种来源获得的信息用客体、概念、关系要素来表现,并将它们连接起来以图表形式表现。
[0009]进一步地,所述搜索结果包括知识图谱中的关键词以及知识图谱所联系的内容数据库中的内容。
[0010]进一步地,所述知识图谱所联系的内容数据库中的内容的搜索结果的获得方法包括以下步骤:基于元组中的关键词以及图表中心度从知识图谱中提取至少一个重要关键词;评价重要关键词的权重;内容标签是内容数据库中赋予内容的标签,用于区分内容;基于重要关键词的权重进行TOP

N的方式进行筛选获得重要关键词集合;基于重要关键词集合联系数据库中与其关联或匹配的内容作为搜索结果。
[0011]进一步地,所述基于元组中的关键词以及图表中心度从知识图谱中提取至少一个重要关键词是基于近似性中心度的提取方式,是从知识结构图表中提取与元组中的关键词连接的最短路径的节点对应的关键词。
[0012]进一步地,所述重要关键词的权重由以下公式计算:其中,表示关键词的TF*IDF值,表示关键词中最大的TF*IDF值,表示关键词的链接数,是拥有最多链接的关键词链接数,表示关键词是否属于内容的标签(属于为1,不属于为0),w1,w2,w3表示权重系数。
[0013]根据本专利技术的一个方面,提供了基于知识图谱的查询装置,包括:信息获得单元、预处理单元、知识图谱映射单元和搜索服务提供单元,其中,信息获得单元用于获得包含搜索关键词的客体或概念的用户搜索信息;预处理单元用于将获得的用户搜索信息分割为最小意义单位的关键词元素;知识图谱映射单元根据预处理单元分离的关键词要素生成关键词数据对应组,基于所述关键词数据对应组根据预先设置的组合规则消除重复元素生成顺序对组合。
[0014]进一步地,所述分割最小意义单位关键词要素的方法可以利用复合名词词典、用
语词典、体言词典等,将这些现有的记载的单词和短文选择为最小关键词要素。
[0015]进一步地,所述知识图谱映射单元至少包括关键词对应生成单元、元组组合单元和元组映射单元,其中,关键词对应组生成单元用于根据所分割的各个关键词元素生成关键词数据对应组;元组组合单元用于根据预定的组合规则生成顺序对组合;元组映射器用于将生成的顺序对组合映射到知识图谱中生成元组。
[0016]本专利技术的有益效果在于:本专利技术的基于对于检索输入内容的处理映射以及匹配,使其符合知识图谱的知识结构,能够基于知识图谱得到更为匹配的内容,充分发挥知识图谱的知识结构的优越性。
附图说明
[0017]图1是本专利技术实施例的基于知识图谱的查询方法的流程示意图;图2是本专利技术实施例的关键词对应组根据预定的组合规则生成顺序对组合的流程示意图;图3是本专利技术实施例的基于知识图谱的查询装置的模块示意图一;图4是本专利技术实施例的基于知识图谱的查询装置的知识图谱映射单元的模块示意图;图5是本专利技术实施例的基于知识图谱的查询装置的模块示意图二。
[0018]图中:信息获得单元100、预处理单元200、知识图谱映射单元300、搜索服务提供单元400、内容服务器500、关键词对应生成单元310、元组组合单元320、元组映射单元330。
具体实施方式
[0019]现在将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本说明书内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。例如,所描述的方法可以按照与所描述的顺序不同的顺序来执行,以及各个步骤可以被添加、省略或者组合。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
[0020]在本实施例中提供了基于知识图谱的查询方法,如图1所示是根据本专利技术的基于知识图谱的查询方法的流程示意图,如图1所示,该基于知识图谱的查询方法,包括以下步骤:步骤S11,获得包括客体或概念的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的查询方法,其特征在于,包括以下步骤:步骤S11,获得包括客体或概念的用户搜索信息;步骤S12,将用户搜索文信息划分为最小意义单位的关键词元素;步骤S13,根据各个关键词要素生成关键词数据对应组;步骤S14,关键词对应组根据预定的组合规则生成顺序对组合;步骤S15,将生成的顺序对组合映射到知识图谱中生成元组;步骤S16,为生成的元组的用户提供搜索结果。2.根据权利要求1所述的基于知识图谱的查询方法,其特征在于,所述关键词对应组根据预定的组合规则生成顺序对组合包括以下步骤:步骤S21,按照一个关系的关键词要素加两个本体的关键词要素生成多个关键词数据对应组;步骤S22,提取上述关键词数据对应组中的一个,并将该关键词数据组与其他的关键词数据组对比,删除与其关键词要素完全重复的关键词数据组;步骤S23,提取下一个关键词数据对应组,并将该关键词数据组与其他的关键词数据组对比,删除与其关键词要素完全重复的关键词数据组;步骤S24,重复上一步骤,直至所有关键词数据对应组对比完毕。3.根据权利要求1所述的基于知识图谱的查询方法,其特征在于,所述知识图谱是将从多种来源获得的信息用客体、概念、关系要素来表现,并将它们连接起来以图表形式表现。4.根据权利要求1所述的基于知识图谱的查询方法,其特征在于,所述搜索结果包括知识图谱中的关键词以及知识图谱所联系的内容数据库中的内容。5.根据权利要求4所述的基于知识图谱的查询方法,其特征在于,所述知识图谱所联系的内容数据库中的内容的搜索结果的获得方法包括以下步骤:基于元组中的关键词以及图表中心度从知识图谱中提取至少一个重要关键词;评价重要关键词的权重;内容标签是内容数据库中赋予内容的标签,用于区分内容;基于重要关键词的权重进行TOP

N...

【专利技术属性】
技术研发人员:张伟郝爽臧利利羊晋赵鲲驰孙真真刘光远马凤春
申请(专利权)人:山东省科院易达科技咨询有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1