System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于时空语义约束的知识问答方法、装置和产品制造方法及图纸_技高网

一种基于时空语义约束的知识问答方法、装置和产品制造方法及图纸

技术编号:39975629 阅读:10 留言:0更新日期:2024-01-09 01:07
本申请提供了一种基于时空语义约束的知识问答方法、装置和产品,涉及知识问答技术领域,该方法为:对自然语言问句进行信息抽取,得到抽取结果,所述抽取结果包括实体、谓词、查询对象、显式时间约束、显式地点约束、次序约束、隐式时间约束、隐式地点约束;定义通用查询路径,将抽取结果进行组合编排,生成多个候选查询路径;在目标时空知识图谱中执行每一个候选查询路径,将搜索得到的查询结果与标准答案进行对比,根据对比结果,确定正确查询路径;利用正确查询路径和自然语言问句,进行模型训练,得到查询路径生成模型;将用户的目标问句输入查询路径生成模型,得到目标查询路径,在目标时空知识图谱中执行目标查询路径,得到目标答案。

【技术实现步骤摘要】

本申请涉及知识问答,特别是一种基于时空语义约束的知识问答方法、装置和产品


技术介绍

1、知识图谱是一种通过“节点-关系-节点”组成的知识管理架构,用于对领域实体关系数据进行有效管理。在一些特定领域,知识图谱中会涵盖各类复杂语义的文本信息,实体和关系会在时空维度上动态变化,需要面向领域应用的时空知识图谱模型来实现这种时空动态变化数据的存储、管理和计算。

2、然而,在通过知识图谱执行知识问答的过程中,相关技术往往难以处理复杂时空语义约束下的知识问答问题,即,当问句中存在语义较为复杂的时空限制条件时,往往难以在知识图谱中直接查询得到相应的答案,问答正确率较低。

3、因此,有必要开发一种基于时空语义约束的知识问答方法、装置和产品,以提高知识问答准确率。


技术实现思路

1、鉴于上述问题,本申请实施例提供了一种基于时空语义约束的知识问答方法、装置和产品,以便克服上述问题或者至少部分地解决上述问题。

2、本申请实施例的第一方面,提供了一种基于时空语义约束的知识问答方法,包括:

3、对自然语言问句进行信息抽取,得到抽取结果,所述抽取结果包括实体、谓词、查询对象、显式时间约束、显式地点约束、次序约束、隐式时间约束、隐式地点约束;

4、定义通用查询路径,将所述抽取结果进行组合编排,生成多个候选查询路径;

5、在目标时空知识图谱中执行每一个所述候选查询路径,将搜索得到的查询结果与标准答案进行对比,根据对比结果,从所述多个候选查询路径中确定正确查询路径;

6、利用所述正确查询路径和所述自然语言问句,进行模型训练,得到查询路径生成模型;

7、将用户的目标问句输入所述查询路径生成模型,得到目标查询路径,在所述目标时空知识图谱中执行所述目标查询路径,得到目标答案。

8、在一种可能的实施方式中,所述对自然语言问句进行信息抽取,得到抽取结果,包括:

9、通过ac自动机、es引擎和嵌入语言模型,对所述自然语言问句进行关键词召回,生成关键词召回结果;

10、通过向量引擎,依据语义相似度对所述自然语言问句进行向量召回,生成向量召回结果;

11、对所述关键词召回结果和所述向量召回结果进行加权融合,得到所述抽取结果。

12、在一种可能的实施方式中,所述通过ac自动机、es引擎和嵌入语言模型,对所述自然语言问句进行关键词召回,生成关键词召回结果,包括:

13、通过所述ac自动机,对所述自然语言问句进行关键词召回,得到第一关键词召回结果;

14、通过所述es引擎,对所述自然语言问句进行关键词召回,将召回的第一个五元组作为第二关键词召回结果;

15、通过所述嵌入语言模型,对所述自然语言问句进行关键词召回,基于得到的多个五元组中的前n个五元组,统计实体出现次数,将出现次数最多的k个实体作为第三关键词召回结果,其中k和n分别为大于1的正整数;

16、将所述第二关键词召回结果和所述第三关键词召回结果进行加权融合,得到候选实体集;

17、将所述候选实体集和所述第一关键词召回结果进行结合,得到所述关键词召回结果。

18、在一种可能的实施方式中,所述候选查询路径包括以下一项或多项:

19、次序约束信息,表示所述自然语言问句是否按照时间顺序取查询结果的第一个、最后一个、或全部;

20、显式时间约束信息,表示在所述自然语言问句中直接存在的时间约束信息,包括:时间约束的粒度、时间约束的方向、时间值;

21、隐式时间约束信息,表示不在所述自然语言问句中直接存在,但包含在语义中的时间约束信息,包括:时间约束的粒度、时间约束的方向和通过三元组查询获取的隐式时间值;

22、显式地点约束信息,表示在所述自然语言问句中直接存在的位置约束信息,包括:地点约束的粒度、地点约束的方向、地点值;

23、隐式地点约束信息,表示不在所述自然语言问句中直接存在,但包含在语义中的位置约束信息,包括:地点约束的粒度、地点约束的方向和通过三元组查询获取的隐式地点值;

24、主查询信息,表示所述自然语言问句中查询目标的信息,包括查询目标和通过三元组查询获取的隐式查询信息。

25、在一种可能的实施方式中,在执行每一个所述候选查询路径之前,所述方法还包括:

26、对所述多个候选查询路径中违背预设规则的错误查询路径进行剪枝;

27、根据所述候选查询路径所对应的实体或谓词在所述抽取结果中的优先级,对剪枝后的候选查询路径进行优先级排序;

28、所述从所述多个候选查询路径中确定正确查询路径,包括:

29、在从所述多个候选查询路径中确定出多个正确的候选查询路径的情况下,将所述多个正确的候选查询路径中优先级最高的候选查询路径确定为所述正确查询路径。

30、在一种可能的实施方式中,所述查询路径生成模型包括t5模型和bert模型,所述利用所述正确查询路径和所述自然语言问句,进行模型训练包括:

31、以所述自然语言问句为输入的训练样本,以对应的所述正确查询路径为标签,对所述t5模型进行训练;

32、以所述自然语言问句和对应的所述候选查询路径为输入的训练样本,以所述候选查询路径是否为所述正确查询路径为标签,对所述bert模型进行训练。

33、在一种可能的实施方式中,所述将用户的目标问句输入所述查询路径生成模型,得到目标查询路径,在所述目标时空知识图谱中执行所述目标查询路径,得到目标答案,包括:

34、将所述用户的目标问句输入所述t5模型,得到第一目标查询路径;

35、将所述用户的目标问句和所述目标问句的候选查询路径输入所述bert模型,得到第二目标查询路径;

36、在所述目标时空图谱中分别执行所述第一目标查询路径和所述第二目标查询路径,得到多个候选目标答案;

37、将所述多个候选目标答案融合,得到所述目标答案。

38、本申请实施例第二方面还提供了一种基于时空语义约束的知识问答装置,所述装置包括:

39、信息抽取模块,用于对自然语言问句进行信息抽取,得到抽取结果,所述抽取结果包括实体、谓词、查询对象、显式时间约束、显式地点约束、次序约束、隐式时间约束、隐式地点约束;

40、候选查询路径生成模块,用于定义通用查询路径,将所述抽取结果进行组合编排,生成多个候选查询路径;

41、正确查询路径确定模块,用于在目标时空知识图谱中执行每一个所述候选查询路径,将搜索得到的查询结果与标准答案进行对比,根据对比结果,从所述多个候选查询路径中确定正确查询路径;

42、训练模块,用于利用所述正确查询路径和所述自然语言问句,进行模型训练,得到查询路径生成模型;

43、知识问答模块,用于将用户的目标问句输入所述查询路径生成模型,得到目标查询本文档来自技高网...

【技术保护点】

1.一种基于时空语义约束的知识问答方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于时空语义约束的知识问答方法,其特征在于,所述对自然语言问句进行信息抽取,得到抽取结果,包括:

3.根据权利要求2所述的基于时空语义约束的知识问答方法,其特征在于,所述通过AC自动机、ES引擎和嵌入语言模型,对所述自然语言问句进行关键词召回,生成关键词召回结果,包括:

4.根据权利要求1所述的基于时空语义约束的知识问答方法,其特征在于,所述候选查询路径包括以下一项或多项:

5.根据权利要求1所述的基于时空语义约束的知识问答方法,其特征在于,在执行每一个所述候选查询路径之前,所述方法还包括:

6.根据权利要求1所述的基于时空语义约束的知识问答方法,其特征在于,所述查询路径生成模型包括T5模型和BERT模型,所述利用所述正确查询路径和所述自然语言问句,进行模型训练包括:

7.根据权利要求6所述的基于时空语义约束的知识问答方法,其特征在于,所述将用户的目标问句输入所述查询路径生成模型,得到目标查询路径,在所述目标时空知识图谱中执行所述目标查询路径,得到目标答案,包括:

8.一种基于时空语义约束的知识问答装置,其特征在于,所述装置包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-7中任一项所述的基于时空语义约束的知识问答方法。

10.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1-7中任一项所述的基于时空语义约束的知识问答方法。

...

【技术特征摘要】

1.一种基于时空语义约束的知识问答方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于时空语义约束的知识问答方法,其特征在于,所述对自然语言问句进行信息抽取,得到抽取结果,包括:

3.根据权利要求2所述的基于时空语义约束的知识问答方法,其特征在于,所述通过ac自动机、es引擎和嵌入语言模型,对所述自然语言问句进行关键词召回,生成关键词召回结果,包括:

4.根据权利要求1所述的基于时空语义约束的知识问答方法,其特征在于,所述候选查询路径包括以下一项或多项:

5.根据权利要求1所述的基于时空语义约束的知识问答方法,其特征在于,在执行每一个所述候选查询路径之前,所述方法还包括:

6.根据权利要求1所述的基于时空语义约束的知识问答方法,其特征在于,所述查询路径生成模型包括t5...

【专利技术属性】
技术研发人员:杨国利刘艺刘昊白晓颖史殿习
申请(专利权)人:北京大数据先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1