图谱检索方法和装置、电子设备和存储介质制造方法及图纸

技术编号:35773773 阅读:8 留言:0更新日期:2022-12-01 14:16
本申请提供了一种图谱检索方法和装置、电子设备和存储介质。其中,方法包括:获取需要进行答案搜索的问题信息;确定出问题信息对应的候选实体,以及候选实体的实体类别;按照实体类别,在模式图中查询到包含有至少一个目标节点的候选路径,其中,目标节点为用于指示实体类别的节点;根据所有候选路径,以及实体类别对应的候选实体,生成目标查询图,其中,目标查询图中包括所有目标节点;按照目标查询图解析得到查询语言,并基于查询语言查询到问题信息对应的答案。本实施例中的方法,克服了相关技术中需要人工定义用于图谱检索的模板进而导致成本很高,且泛化性能差的技术问题。且泛化性能差的技术问题。且泛化性能差的技术问题。

【技术实现步骤摘要】
图谱检索方法和装置、电子设备和存储介质


[0001]本申请涉及数据搜索
,尤其涉及一种图谱检索方法和装置、电子设备和存储介质。

技术介绍

[0002]图谱检索即给定自然语言问题,通过对问题进行语义理解和解析,进而利用知识库进行查询、推理得出答案。图谱检索是搜索和智能问答中常用的技术方案。其中基于信息检索的方法的流程是:首先,根据问题得到若干个候选实体。然后,从知识库中抽取与候选实体相连的关系作为候选查询路径。接着,使用文本匹配模型,选择出与问题相似度最高的候选查询路径。最后,到知识库中检索答案。该方法由于需要从数据库中逐步搜索,而图谱中往往有丰富的实体和关系。使得该步骤有较高的时间消耗。
[0003]目前,相关技术中采用基于语义解析图谱检索方法使用字典、规则和机器学习直接从问题中解析出实体、关系和逻辑组合,生成可执行语言,直接从图数据库中进行一次搜索,获得答案的方式。但是由于用于提出的问题形式多种多样,人工定义用于图谱检索的模板的成本很高,且泛化性能差。
[0004]因此,相关技术中存在人工定义用于图谱检索的模板的成本很高,且泛化性能差的问题。

技术实现思路

[0005]本申请提供了一种图谱检索方法和装置、电子设备和存储介质,以至少解决相关技术中存在的人工定义用于图谱检索的模板的成本很高,且泛化性能差的问题。
[0006]根据本申请实施例的一个方面,提供了一种图谱检索方法,包括:
[0007]获取需要进行答案搜索的问题信息;
[0008]确定出所述问题信息对应的候选实体,以及所述候选实体的实体类别;
[0009]按照所述实体类别,在模式图中查询到包含有至少一个目标节点的候选路径,其中,所述目标节点为用于指示所述实体类别的节点;
[0010]根据所有所述候选路径,以及所述实体类别对应的所述候选实体,生成目标查询图,其中,所述目标查询图中包括所有所述目标节点;
[0011]按照所述目标查询图解析得到查询语言,并基于所述查询语言查询到所述问题信息对应的答案。
[0012]可选地,如前述的方法,所述按照所述实体类别,在模式图中查询到包含有至少一个目标节点的候选路径,包括:
[0013]按照所述实体类别,以及预设的最大跳变次数,在所述模式图中执行至少一轮遍历操作,查询到包含有所述目标节点的至少一个所述候选路径,其中,最大跳变次数用于指示从所述目标节点跳转至最远节点所需经过的节点的个数,所述最远节点是所述候选路径中与所述目标节点之间间隔最多数量其他节点的节点,每轮所述遍历操作中执行的跳变次
数小于或等于所述最大跳变次数,不同的所述候选路径之间至少存在一个不同的节点。
[0014]可选地,如前述的方法,所述按照所述实体类别,以及预设的最大跳变次数,在所述模式图中执行至少一轮遍历操作,查询到包含有所述目标节点的至少一个所述候选路径,包括:
[0015]以所述实体类别对应的目标节点作为所述遍历操作的起始节点,在所述模式图中执行N次跳变操作,其中,N为所述最大跳变次数的数值;
[0016]循环执行以下操作,直至已执行N次跳变操作:在所述N次跳变操作中已执行的跳变操作的总数M次小于N次,且第M+1次跳变操作跳变至的跳变后节点与第M次跳变操作时位于的当前节点之间满足预设关系的情况下,将所述跳变后节点以及所述当前节点作为复实体,并确定已执行M次跳变操作,其中,M为整数,且0≤M<N,所述预设关系包括:所述跳变后节点与所述当前节点中存在一个CVT节点,且所述CVT节点用于描述所述跳变后节点与所述当前节点中除所述CVT节点之外的另一节点的场景;在所述N次跳变操作中已执行的跳变操作的总数M次小于N次,且第M+1次跳变操作跳变至的跳变后节点与第M次跳变操作时位于的当前节点之间不满足所述预设关系的情况下,确定已执行M+1次跳变操作;
[0017]在已执行N次跳变操作的情况下,按照所述N次跳变操作中每次跳变操作的先后次序,将所述起始节点以及所述N次跳变操作中的每次跳变操作所跳变至的节点相连,得到所述候选路径。
[0018]可选地,如前述的方法,所述确定出所述问题信息对应的候选实体,以及所述候选实体的实体类别,包括:
[0019]对所述问题信息进行实体识别,确定出包含于所述问题信息中的第一实体,以及所述第一实体的实体类别;
[0020]按照所述实体类别,在图数据库中确定与所述第一实体满足预设相关性的第二实体,其中,所述图数据库中预设有多个实体,所述第二实体的实体类别为所述第一实体的实体类别;
[0021]根据所述第一实体以及所述第二实体确定出所有所述候选实体,并确定出与每个所述候选实体对应的实体类别。
[0022]可选地,如前述的方法,所述根据所有所述候选路径,以及所述实体类别对应的所述候选实体,生成目标查询图,包括:
[0023]根据所有所述候选路径,确定出任意两个候选节点之间的关联关系,其中,所述候选节点为所述候选路径中的节点;
[0024]根据所述实体类别对应的所述候选实体,确定与每个候选节点对应的属性信息;
[0025]根据所述关联关系、所述候选节点以及与每个候选节点对应的属性信息,得到多个候选查询图,其中,对于每个所述候选查询图,所述候选查询图中包括多个候选节点,所述多个候选节点按照所述关联关系进行连接,且每个所述候选节点具有对应的所述属性信息;
[0026]按照预设匹配度算法,在所述多个候选查询图中确定出与所述问题信息匹配度最高的所述目标查询图。
[0027]可选地,如前述的方法,所述按照所述目标查询图解析得到查询语言,并基于所述查询语言查询到所述问题信息对应的答案,包括:
[0028]根据所述目标查询图中的各个第一目标节点以及各个第一目标节点之间的关联关系,确定出语义表达结构;
[0029]按照所述语义表达结构生成查询语言;
[0030]通过所述查询语言在图数据库中进行查询,得到所述答案。
[0031]可选地,如前述的方法,所述根据所述目标查询图中的各个第一目标节点以及各个第一目标节点之间的关联关系,确定出语义表达结构包括:
[0032]在所述目标查询图中确定出主链以及支链;
[0033]确定出所述主链上的所有第二目标节点,所述所有第二目标节点中每个第二目标节点的属性信息,以及任意两个相互连接的所述第二目标节点之间的主链关联关系,其中,所有所述第一目标节点包括第二目标节点;确定出所述支链上的所有第三目标节点,所述所有第三目标节点中每个第三目标节点的属性信息,以及任意两个相互连接的所述第三目标节点之间的支链关联关系,其中,所述支链上的所述所有第三目标节点中存在一个位于所述主链上的第二目标节点,所有所述第一目标节点包括第三目标节点;
[0034]按照所述第二目标节点的属性信息、所述主链关联关系、所述第三目标节点的属性信息以及所述支链关联关系生成所述语义表达结构。
[0035]根据本申本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图谱检索方法,其特征在于,包括:获取需要进行答案搜索的问题信息;确定出所述问题信息对应的候选实体,以及所述候选实体的实体类别;按照所述实体类别,在模式图中查询到包含有至少一个目标节点的候选路径,其中,所述目标节点为用于指示所述实体类别的节点;根据所有所述候选路径,以及所述实体类别对应的所述候选实体,生成目标查询图,其中,所述目标查询图中包括所有所述目标节点;按照所述目标查询图解析得到查询语言,并基于所述查询语言查询到所述问题信息对应的答案。2.根据权利要求1所述的方法,其特征在于,所述按照所述实体类别,在模式图中查询到包含有至少一个目标节点的候选路径,包括:按照所述实体类别,以及预设的最大跳变次数,在所述模式图中执行至少一轮遍历操作,查询到包含有所述目标节点的至少一个所述候选路径,其中,最大跳变次数用于指示从所述目标节点跳转至最远节点所需经过的节点的个数,所述最远节点是所述候选路径中与所述目标节点之间间隔最多数量其他节点的节点,每轮所述遍历操作中执行的跳变次数小于或等于所述最大跳变次数,不同的所述候选路径之间至少存在一个不同的节点。3.根据权利要求2所述的方法,其特征在于,所述按照所述实体类别,以及预设的最大跳变次数,在所述模式图中执行至少一轮遍历操作,查询到包含有所述目标节点的至少一个所述候选路径,包括:以所述实体类别对应的目标节点作为所述遍历操作的起始节点,在所述模式图中执行N次跳变操作,其中,N为所述最大跳变次数的数值;循环执行以下操作,直至已执行N次跳变操作:在所述N次跳变操作中已执行的跳变操作的总数M次小于N次,且第M+1次跳变操作跳变至的跳变后节点与第M次跳变操作时位于的当前节点之间满足预设关系的情况下,将所述跳变后节点以及所述当前节点作为复实体,并确定已执行M次跳变操作,其中,M为整数,且0≤M<N,所述预设关系包括:所述跳变后节点与所述当前节点中存在一个CVT节点,且所述CVT节点用于描述所述跳变后节点与所述当前节点中除所述CVT节点之外的另一节点的场景;在所述N次跳变操作中已执行的跳变操作的总数M次小于N次,且第M+1次跳变操作跳变至的跳变后节点与第M次跳变操作时位于的当前节点之间不满足所述预设关系的情况下,确定已执行M+1次跳变操作;在已执行N次跳变操作的情况下,按照所述N次跳变操作中每次跳变操作的先后次序,将所述起始节点以及所述N次跳变操作中的每次跳变操作所跳变至的节点相连,得到所述候选路径。4.根据权利要求1所述的方法,其特征在于,所述确定出所述问题信息对应的候选实体,以及所述候选实体的实体类别,包括:对所述问题信息进行实体识别,确定出包含于所述问题信息中的第一实体,以及所述第一实体的实体类别;按照所述实体类别,在图数据库中确定与所述第一实体满足预设相关性的第二实体,其中,所述图数据库中预设有多个实体,所述第二实体的实体类别为所述第一实体的实体类别;
根据所述第一实体以及所述第二实体确定出所有所述候选实体,并确定出与每个所述候选实体对应的实体类别。5.根据权利要求1所述的方法,其特征在于,所述根据所有所述候选路径...

【专利技术属性】
技术研发人员:苑世娇荆小兵
申请(专利权)人:北京明略昭辉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1