一种基于规则推理的知识图谱检索方法与系统技术方案

技术编号:38317691 阅读:18 留言:0更新日期:2023-07-29 08:59
本发明专利技术涉及一种基于规则推理的知识图谱检索方法与系统,属于知识图谱技术领域,解决了现有检索结果准确度低的问题。包括获取用户问题,提取用户问题中的关键词,并根据文本分类模型,得到用户问题对应的细类;基于知识图谱中知识内容的关系,根据关键词和细类,检索出关联的知识内容,得到检索结果;知识图谱中知识内容的关系定期更新,包括:根据关键词预测模型,提取知识内容隐藏的关键词,建立知识内容与关键词的关系;和/或,构建推理任务,利用条件规则模板和结果规则模板,对每个推理任务配置条件规则和结果规则,运行校验通过的推理任务,建立或更新知识内容与关键词和/或细类之间的关系。实现了检索结果准确度和用户满意度的提升。意度的提升。意度的提升。

【技术实现步骤摘要】
一种基于规则推理的知识图谱检索方法与系统


[0001]本专利技术涉及知识图谱
,尤其涉及一种基于规则推理的知识图谱检索方法与系统。

技术介绍

[0002]随着科学技术的迅速发展,各个行业都产生了庞大的数据,其中大多数查询和使用都是以关系型数据库为基础。但在进行复杂的关系查询和关系分析的时候就会出现瓶颈,大量数据的表和多表关联查询明显会降低查询的效率,为了更好的存储和分析这样的关系型数据,以及充分利用非结构化的数据,图数据库存储技术应运而生,同时基于图数据库的各种知识图谱的应用也越来越多。
[0003]知识图谱的检索旨在从现有的知识图谱中快速找到精准结果。现有的检索关注于知识图谱中关键词的检索比对,只是找出知识库内容中比对到的结果就进行输出,但是关键词往往不能反映客户问题的本意,对于反馈的检索结果是否满足用户需求,是否真正理解用户要的结果都没有很好的处理。而且,知识图谱的更新也仅仅是由于业务数据发生了变更而变更,缺少更深层次或更多维度的信息,比如,一些知识内容表达中没有提到某关键词但确实是与该关键词有关的信息,就无法关联检索出来,导致检索结果准确度低。
[0004]因此,现有技术中缺少检索条件与检索结果的精确匹配,忽略了用户问题中隐含的实体和关系信息,导致缺少了大量有价值的数据,检索结果没有按最接近用户语义理解的顺序展示。

技术实现思路

[0005]鉴于上述的分析,本专利技术实施例旨在提供一种基于规则推理的知识图谱检索方法及系统,用以解决现有因缺少更深层次的信息而导致检索结果准确度低的问题。
[0006]一方面,本专利技术实施例提供了一种基于规则推理的知识图谱检索方法,包括以下步骤:
[0007]获取用户问题,提取用户问题中的关键词,并根据文本分类模型,得到用户问题对应的细类;基于知识图谱中知识内容的关系,根据关键词和细类,检索出关联的知识内容,得到检索结果;
[0008]知识图谱中知识内容的关系定期更新,包括:
[0009]根据关键词预测模型,提取知识内容隐藏的关键词,建立知识内容与关键词的关系;
[0010]和/或,构建推理任务,利用条件规则模板和结果规则模板,对每个推理任务配置条件规则和结果规则,运行校验通过的推理任务,建立或更新知识内容与关键词和/或细类之间的关系。
[0011]基于上述方法的进一步改进,根据文本分类模型,得到用户问题对应的细类,包括:
[0012]根据历史用户问题及其对应的细类,构建第一样本集,并利用第一样本集训练好TextCNN文本分类模型;对获取的用户问题进行分词和向量化后,传入TextCNN文本分类模型,得到对应的细类。
[0013]基于上述方法的进一步改进,基于知识图谱中知识内容的关系,根据关键词和细类,检索出关联的知识内容,排序得到检索结果,包括:
[0014]基于知识图谱中知识内容与关键词和细类之间的关系,根据关键词,检索出关联的知识内容、关系权重和所属细类,得到检索结果;依次按照细类、关键词词频和关系权重对检索结果进行排序。
[0015]基于上述方法的进一步改进,关键词预测模型通过以下步骤得到:对知识图谱中的知识内容,人工标注出隐藏的关键词作为样本标签,对知识内容进行分词处理后,构建第二样本集;构建特征序列模型并利用第二样本集进行训练,得到关键词预测模型。
[0016]基于上述方法的进一步改进,条件规则模板包括:实体A与实体B具有关系C、实体A的属性B满足条件C、关系A的属性B满足条件C,定义实体A的属性为变量B、定义关系A的属性为变量B、变量A与变量B满足条件C;结果规则模板包括:实体A和实体B添加关系C,实体A的属性B设置为C,关系A的属性B设置为C。
[0017]基于上述方法的进一步改进,基于知识图谱,利用条件规则模板和结果规则模板,对每个推理任务配置条件规则和结果规则,包括:选择知识图谱中的实体、关系、实体属性和关系属性,配置1个或多个条件规则,及1个结果规则;同一个实体、关系、实体属性和关系属性在同一个推理任务中分别用唯一的变量名来标识;条件规则模板中的条件包括操作符和条件值;多个条件规则之间是“并且”的关系。
[0018]基于上述方法的进一步改进,校验通过的推理任务,是指推理任务中的条件规则和结果规则的变量名有效,条件值与属性类型匹配,及属性值有效。
[0019]基于上述方法的进一步改进,变量名有效包括:每个变量名中不包括中文和符号;每个变量名只对应同一个实体或关系或属性;并且,根据“定义实体A的属性为变量B”和/或“定义关系A的属性为变量B”规则模板配置的条件规则中的变量名存在于“变量A与变量B满足条件C”规则模板配置的条件规则中;
[0020]条件值与属性类型匹配包括:条件值不为NULL或空字符串;并且,条件值与对应的实体或关系的属性的类型匹配;
[0021]属性值有效包括:属性值不为空,且属性值存在于对应的实体或关系中。
[0022]基于上述方法的进一步改进,运行校验通过的推理任务,建立或更新知识内容与关键词和/或细类之间的关系,包括:
[0023]将推理任务中的条件规则转换为图数据库的查询操作语句;
[0024]将推理任务中的结果规则转换为图数据库的结果操作语句;
[0025]执行查询操作语句,获取查询结果,再对查询结果执行结果操作语句,建立或更新结果操作语句对应的关系。
[0026]另一方面,本专利技术实施例提供了一种基于规则推理的知识图谱检索系统,包括:
[0027]问题检索模块,用于获取用户问题,提取用户问题中的关键词,并根据文本分类模型,得到用户问题对应的细类;基于知识图谱中知识内容的关系,根据关键词和细类,检索出关联的知识内容,得到检索结果;
[0028]图谱更新模块,用于定期更新知识图谱中知识内容的关系,包括:根据关键词预测模型,提取知识内容隐藏的关键词,建立知识内容与关键词的关系;和/或,构建推理任务,利用条件规则模板和结果规则模板,对每个推理任务配置条件规则和结果规则,运行校验通过的推理任务,建立或更新知识内容与关键词和/或细类之间的关系。
[0029]与现有技术相比,本专利技术至少可实现如下有益效果之一:通过深度学习定位问题类别,通过NLP识别关键词,通过机器学习和推理任务的配置和执行,挖掘出潜在的知识关系来补充更新知识图谱,提升检索结果的准确度;结合深度学习对问题样本的处理,把问题进行细分,更好地识别用户提问的意图;结合机器学习模型预测出知识内容和隐藏的关键词的关联关系;结合规则模板快速地组合各种条件规则和结果规则来配置推理任务,挖掘出隐含的实体属性和关联关系,方便快捷,便于理解,操作用户只需具备业务知识,不用编写复杂的图数据库语句,也不用具备图算法等专业知识进行数据分析;通过对知识库数据的关系补充和问题意图的识别,增加知识的丰富性和全面性,提升了检索结果准确度和用户满意度。
[0030]本专利技术中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于规则推理的知识图谱检索方法,其特征在于,包括以下步骤:获取用户问题,提取用户问题中的关键词,并根据文本分类模型,得到用户问题对应的细类;基于知识图谱中知识内容的关系,根据关键词和细类,检索出关联的知识内容,得到检索结果;所述知识图谱中知识内容的关系定期更新,包括:根据关键词预测模型,提取知识内容隐藏的关键词,建立知识内容与关键词的关系;和/或,构建推理任务,利用条件规则模板和结果规则模板,对每个推理任务配置条件规则和结果规则,运行校验通过的推理任务,建立或更新知识内容与关键词和/或细类之间的关系。2.根据权利要求1所述的基于规则推理的知识图谱检索方法,其特征在于,所述根据文本分类模型,得到用户问题对应的细类,包括:根据历史用户问题及其对应的细类,构建第一样本集,并利用第一样本集训练好TextCNN文本分类模型;对获取的用户问题进行分词和向量化后,传入TextCNN文本分类模型,得到对应的细类。3.根据权利要求1所述的基于规则推理的知识图谱检索方法,其特征在于,所述基于知识图谱中知识内容的关系,根据关键词和细类,检索出关联的知识内容,排序得到检索结果,包括:基于知识图谱中知识内容与关键词和细类之间的关系,根据关键词,检索出关联的知识内容、关系权重和所属细类,得到检索结果;依次按照细类、关键词词频和关系权重对检索结果进行排序。4.根据权利要求1所述的基于规则推理的知识图谱检索方法,其特征在于,所述关键词预测模型通过以下步骤得到:对知识图谱中的知识内容,人工标注出隐藏的关键词作为样本标签,对知识内容进行分词处理后,构建第二样本集;构建特征序列模型并利用第二样本集进行训练,得到关键词预测模型。5.根据权利要求1所述的基于规则推理的知识图谱检索方法,其特征在于,所述条件规则模板包括:实体A与实体B具有关系C、实体A的属性B满足条件C、关系A的属性B满足条件C,定义实体A的属性为变量B、定义关系A的属性为变量B、变量A与变量B满足条件C;所述结果规则模板包括:实体A和实体B添加关系C,实体A的属性B设置为C,关系A的属性B设置为C。6.根据权利要求5所述的基于规则推理的知识图谱检索方法,其特征在于,所述基于知识图谱,利用条件规则模板和结果规则模板...

【专利技术属性】
技术研发人员:陈细平邓荣平郑圳洺魏倩姚家渭
申请(专利权)人:杭州半云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1