一种基于知识融合的推理问答方法技术

技术编号:36758487 阅读:9 留言:0更新日期:2023-03-04 10:51
本发明专利技术公开了一种基于知识融合的推理问答方法,其中,该方法包括:获取待处理问题文本中的关键实体和非关键实体,并确定关键实体对应的第一解释文本信息和非关键实体对应的第二解释文本信息;基于关键实体、非关键实体、第一解释文本信息和第二文本信息,确定与待处理问题文本对应的待使用背景知识向量;确定与待处理问题文本对应的待使用问题向量,并基于待使用问题向量和待使用背景知识向量,得到目标问题向量;确定与目标问题向量对应的至少一个候选答案实体,并根据各候选答案实体对应的答案评估属性,得到目标答案实体,以基于目标答案实体确定与待处理问题文本对应的目标答案。取到了更加准确的确定与输入问题相对应的答案信息的效果。案信息的效果。案信息的效果。

【技术实现步骤摘要】
一种基于知识融合的推理问答方法


[0001]本专利技术涉及机器阅读理解
,尤其涉及一种基于知识融合的推理问答方法。

技术介绍

[0002]随着人工智能的快速发展,自动问答系统作为强人工智能的愿景之一。
[0003]目前,自动问答系统包括总体上可以划分为两个阶段。第一阶段为从预先构建的知识库进行问答匹配,第二阶段集中在计算机能够真正理解问题含义,并通过添加开放的知识来增强问答推理能力。但第一阶段的问答系统应用范围较小,且对问答数据库的精度和广度要求较高,第二阶段的问答系统对问题的理解不够准确,导致得到的答案也不够准确。
[0004]为了解决上述问题,需要对推理问答方法进行改进。

技术实现思路

[0005]本专利技术提供了一种基于知识融合的推理问答方法,以解决问答系统在对输入问题进行分析时,由于忽略了与输入问题相关联的背景知识,导致得到的答案不够准确的问题。
[0006]第一方面,本专利技术实施例提供了一种基于知识融合的推理问答方法,包括:
[0007]获取待处理问题文本中的关键实体和非关键实体,并确定所述关键实体所对应的第一解释文本信息和所述非关键实体所对应的第二解释文本信息;其中,所述关键实体为与预先设置的实体数据库中的实体相匹配;
[0008]基于所述关键实体、所述非关键实体、所述第一解释文本信息和所述第二文本信息,确定与所述待处理问题文本相对应的待使用背景知识向量;
[0009]确定与所述待处理问题文本相对应的待使用问题向量,并基于所述待使用问题向量和所述待使用背景知识向量,得到目标问题向量;
[0010]确定与所述目标问题向量相对应的至少一个候选答案实体,并根据各候选答案实体所对应的答案评估属性,得到目标答案实体,以基于所述目标答案实体确定与所述待处理问题文本相对应的目标答案。
[0011]本实施例的技术方案,获取待处理问题文本中的关键实体和非关键实体,并确定关键实体所对应的第一解释文本信息和非关键实体所对应的第二解释文本信息,为了构建与待处理问题文本相对应的背景知识信息,基于实体识别技术对待处理问题文本进行实体提取,得到关键实体和非关键实体,同时,从解释文本数据库中获取与关键实体相对应的第一解释文本信息,以及与非关键实体相对应的第二解释文本信息。进一步的,基于关键实体、非关键实体、第一解释文本信息和第二文本信息,确定与待处理问题文本相对应的待使用背景知识向量,基于关键实体和非关键实体构建待匹配三元组,并从待匹配三元组中确定目标三元组,并分别对目标三元组、关键实体、非关键实体、第一解释文本信息和第二文本信息,确定与待处理问题进行向量化处理,得到相应的向量,并根据各向量以及相应的权
重,得到与待处理问题文本相对应的待使用背景知识向量。此外,确定与待处理问题文本相对应的待使用问题向量,并基于待使用问题向量和待使用背景知识向量,得到目标问题向量,基于向量处理模型对待处理问题文本进行向量编码,得到待使用问题向量,并将待使用问题向量与待使用背景知识向量进行拼接,得到目标问题向量。确定与目标问题向量相对应的至少一个候选答案实体,并根据各候选答案实体所对应的答案评估属性,得到目标答案实体,以基于目标答案实体确定与待处理问题文本相对应的目标答案。通过预先训练的模型对目标问题向量进行分析处理,并从答案实体集合中确定与目标问题向量相对应的至少一个候选答案实体,并基于答案评估模型对各候选答案实体进行评估,得到相应的答案评估属性,并将最高答案评估属性所对应的候选答案实体作为目标答案实体,以基于目标答案实体确定与待处理问题文本相对应的目标答案。解决了问答系统在对输入问题进行分析时,由于忽略了与输入问题相关联的背景知识,导致得到的答案不够准确的问题,取到了更加准确的确定与输入问题相对应的答案信息的效果。
[0012]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0014]图1是根据本专利技术实施例一提供的一种基于知识融合的推理问答方法的流程图;
[0015]图2是根据本专利技术实施例二提供的一种基于知识融合的推理问答方法的流程图;
[0016]图3是根据本专利技术实施例二提供的一种基于ALBERT模型确定待使用背景知识向量的示意图;
[0017]图4是根据本专利技术实施例二提供的一种GPT

2模型确定待使用问题向量的示意图。
具体实施方式
[0018]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0019]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
[0020]在对本技术方案进行阐述之前,先对本技术方案的应用场景进行简单介绍,以便更加清楚地理解本技术方案。
[0021]自动问答系统对于人工智能的发展十分重要,目前的自动问答系统通常分为两
类:其一为基于知识库的问答系统,一般是将用户输入的问题利用实体识别技术结合语法分析,将问题转换为数据库查询指令,然后在相应的数据库中进行查询输出答案。但是这种问答方式非常依赖于问答数据库的建立,需要根据限定领域和应用方向感人为建立完备的问答数据库,因此,问答数据库的精度和刚度直接影响问答系统的表现,且通常应用于专业限定领域,其应用范围并不广泛,若用户输入的问题超出了领域限制,问答系统将无法给出准确答案。其二为常识推理问答系统,通常是对问题进行语义理解,并添加开放的知识来增肌推理问答能力,但是这样问答系统通常缺乏对背景知识的考量。
[0022]基于此,本技术方案提出一种基于知识融合的推理问答方法,可应用于基于开放知识的问答系统中,这种问答系统主要关注对问题本身的理解,不在作用于限定领域。此类问答系统主要包括问题分析、信息检索和答案抽取三个阶段,在问题分析阶段,需要对问题进行分类并提取问题中的关键信息,这些关键信息一般就是问题中的实体信息,通常结合实体识别技术来完成;信息检索阶段旨在为问题构建相应的证据,在机器阅读理解问答任务时,会给出一段背景知识证据,以在对问题进行理解时,通过问题所关联的背景知识,更好的理解问题本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识融合的推理问答方法,其特征在于,包括:获取待处理问题文本中的关键实体和非关键实体,并确定所述关键实体所对应的第一解释文本信息和所述非关键实体所对应的第二解释文本信息;其中,所述关键实体为与预先设置的实体数据库中的实体相匹配;基于所述关键实体、所述非关键实体、所述第一解释文本信息和所述第二文本信息,确定与所述待处理问题文本相对应的待使用背景知识向量;确定与所述待处理问题文本相对应的待使用问题向量,并基于所述待使用问题向量和所述待使用背景知识向量,得到目标问题向量;确定与所述目标问题向量相对应的至少一个候选答案实体,并根据各候选答案实体所对应的答案评估属性,得到目标答案实体,以基于所述目标答案实体确定与所述待处理问题文本相对应的目标答案。2.根据权利要求1所述的方法,其特征在于,所述获取待处理问题文本中的关键实体和非关键实体,包括:基于实体识别技术,从待处理问题文本中提取至少一个待确定实体;针对各待确定实体,确定当前实体是否与预先设置的实体数据库中的实体相匹配;若是,则确定所述当前实体为关键实体;若否,则确定所述当前实体为非关键实体。3.根据权利要求1所述的方法,其特征在于,所述确定与所述关键实体相关联的第一解释文本信息和所述非关键实体所对应的第二解释文本信息,包括:根据关键词检测技术,从解释文本数据库中确定与所述关键实体相对应的第一解释文本信息,以及与所述非关键实体相对应的第二解释文本信息;其中,所述解释文本数据库中包括与至少一个实体相关联的解释文本信息。4.根据权利要求1所述的方法,其特征在于,所述基于所述关键实体、所述非关键实体、所述第一解释文本信息和所述第二文本信息,确定与所述待处理问题文本相对应的待使用背景知识向量,包括:基于至少一个非关键实体和所述关键实体,得到至少一个待匹配三元组;在三元组数据库中,分别对各待匹配三元组进行三元组匹配,并将成功匹配的待匹配三元组确定为目标三元组;基于所述目标三元组、所述关键实体、所述非关键实体、所述第一解释文本信息...

【专利技术属性】
技术研发人员:秦科段贵多罗光春许毅董谦董悦洲
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1