推理问答方法、装置以及设备制造方法及图纸

技术编号:25439265 阅读:33 留言:0更新日期:2020-08-28 22:27
本发明专利技术公开了一种推理问答方法、装置以及设备。具体是提出源于实体共现思路的启发式文档检索算法,其能够有效检索出复杂问题所隐含的相关线索文档,同时可以平衡算法效率与准确性;此外,提出了将检索出的目标文档进行拓扑化,作为后续解答、抽取答案的基础;最后再综合用户输入、线索文档、拓扑结构等信息,模拟出人类在推理复杂问题时的推导过程,这样便可针对复杂问题进行精准解答,这其中涉及的检索环节、构建图结构环节以及推理解答环节,相互依赖且步步相关,通过对每一个环节的设计及改进,共同完成了本发明专利技术提出的推理问答机制。

【技术实现步骤摘要】
推理问答方法、装置以及设备
本专利技术涉及自动问答
,尤其涉及一种推理问答方法、装置以及设备。
技术介绍
在人们的日常生活中,需要通过互联网获取某些问题答案的场景非常普遍,这些需要获取的信息往往通过使用问题相关关键字在搜索引擎中进行检索后人工浏览得到。然而,随着信息爆炸的时代到来,网络中充斥着越来越多的垃圾和重复信息,导致使用传统搜索引擎寻找问题答案的过程变得繁琐和低效。因此,人们往往希望拥有能直接通过输入问题即可返回最终答案的自动问答机制。随着近些年来人工智能特别是计算语言学的飞速发展,推动了传统的问答机制准确率的迅速提升并开始走向实用领域。当人们想要获取某个问题的答案时,只需要输入问题即可迅速得获得答案。目前,谷歌、百度等主要的搜索引擎都已将问答服务作为整个搜索引擎中的子系统投入使用,当用户搜索问题为简单问题时,将由问答系统直接返回答案给用户。然而,现有的问答系统往往通过遍历文档库中的每一个文档,并匹配与问题具有相似语义的文本片段作为答案。这种问答方式不具备任何推理能力,因此无法回答较为复杂的问题,同时在检索过程中以及检索后也无法挖掘并结合多个文档的信息,这些缺陷制约了目前问答机制的实用效果。
技术实现思路
鉴于上述,本专利技术旨在提供一种推理问答方法、装置以及设备,并相应地提出一种计算机可读存储介质以及计算机程序产品,通过这些方面能够模拟人类的推理行为,从而回答那些需要一定推理能力才能得出答案的复杂问题。本专利技术采用的技术方案如下:第一方面,本专利技术提供了一种推理问答方法,包括:根据输入问题在知识库中启发式检索出包含解答相关线索的目标文档;基于所述目标文档构建相应的图结构;结合所述输入问题、所述目标文档、所述图结构以及预设的推理解答策略,预测并输出答案。在其中一种可能的实现方式中,所述根据输入问题在知识库中启发式检索出包含解答相关线索的目标文档包括:利用多轮相关性计算以及实体提取策略,从知识库中筛选出包含解答相关线索的若干候选文档;结合所述输入问题,对所述候选文档进行相关性重估;根据重估结果进行重排序,并选取若干高分候选文档作为所述目标文档。在其中一种可能的实现方式中,所述利用多轮相关性计算以及实体提取策略,从知识库中筛选出包含解答相关线索的若干候选文档包括:计算知识库中各第一文档相对于所述输入问题的相关性得分;根据相关性得分,排序后选取若干高分第一文档构建候选文档集合;从所述候选文档集合内的第一文档中提取若干实体;在知识库中检索出与所述实体相关的第二文档;计算各所述第二文档相对于所述输入问题的相关性得分;根据相关性得分,排序后选取若干高分第二文档补入所述候选文档集合。在其中一种可能的实现方式中,所述结合所述输入问题,对所述候选文档进行相关性重估包括:基于预设的语义表示策略,将所述输入问题的信息嵌入到各所述候选文档中,得到包含了上下文信息的各所述候选文档的各单词表示;根据所述单词表示,重新计算各所述候选文档的相关性得分。在其中一种可能的实现方式中,所述基于所述目标文档构建相应的图结构包括:识别出所述目标文档中的命名实体;将所述命名实体以及所述目标文档中的语句作为节点,并基于预设的共现关联策略,构建异构图。在其中一种可能的实现方式中,所述共现关联策略包括如下一或多种:相同命名实体之间建立连接关系;每个命名实体与处于同一语句中的其他命名实体建立连接关系;每个命名实体与所在语句建立连接关系;每个语句与其相邻的前后语句建立连接关系;任意两个语句中若存在相互连接的命名实体,此两个语句建立连接关系。在其中一种可能的实现方式中,所述推理解答策略包括:将全部所述目标文档拼接为线索字符串;基于预设的语义表示策略,将所述输入问题的信息嵌入到所述线索字符串,得到包含了上下文信息的所述线索字符串的各单词表示;利用所述单词表示对所述图结构中相应的节点进行编码;对编码后的节点进行迭代计算,建立节点之间的推理关系。在其中一种可能的实现方式中,所述对编码后的节点进行迭代计算,建立节点之间的推理关系包括:将与所述输入问题相关的节点作为起始节点;计算所述起始节点与各相邻节点间的注意力得分;由所述起始节点与得分最高的相邻节点形成单步推理后的推理链;将所述得分最高的相邻节点作为起始节点,按上述方式进行多轮迭代,得到完整的推理链。在其中一种可能的实现方式中,所述预测并输出答案包括:基于最终形成的所述推理关系,将预测出的最后一个节点作为最终答案直接输出;或者,根据经由迭代计算后包含了推理信息的所述图结构中的各节点,在所述线索字符串中预测答案所在文本片段;将所述文本片段作为最终答案并输出。在其中一种可能的实现方式中,所述根据经由迭代计算后包含了推理信息的所述图结构中的各节点,在所述线索字符串中预测答案所在文本片段包括:将多轮推理后得到的各节点表示,与包含问题信息的所述单词表示融合后,对所述线索字符串中各单词表示进行更新;根据更新后的各单词表示,在所述线索字符串中预测出若干答案起始单词以及若干答案结束单词,并计算对应的概率值;由所述答案起始单词与所述答案结束单词组成若干文本起始对;选取组合概率值最大的文本起始对所对应的文本内容作为所述文本片段。第二方面,本专利技术提供了一种推理问答装置,包括:线索文档检索模块,用于根据输入问题在知识库中启发式检索出包含解答相关线索的目标文档;图结构构建模块,用于基于所述目标文档构建相应的图结构;推理解答模块,用于结合所述输入问题、所述目标文档、所述图结构以及预设的推理解答策略,预测并输出答案。在其中一种可能的实现方式中,所述线索文档检索模块包括:候选文档筛选子模块,用于利用多轮相关性计算以及实体提取策略,从知识库中筛选出包含解答相关线索的若干候选文档;相关性重估子模块,用于结合所述输入问题,对所述候选文档进行相关性重估;线索文档确定子模块,用于根据重估结果进行重排序,并选取若干高分候选文档作为所述目标文档。在其中一种可能的实现方式中,所述候选文档筛选子模块包括:第一计算单元,用于计算知识库中各第一文档相对于所述输入问题的相关性得分;候选文档初步确定单元,用于根据相关性得分,排序后选取若干高分第一文档构建候选文档集合;实体提取单元,用于从所述候选文档集合内的第一文档中提取若干实体;第二文档检索单元,用于在知识库中检索出与所述实体相关的第二文档;第二计算单元,用于计算各所述第二文档相对于所述输入问题的相关性得分;候选文档初最终确定单元,用于根据相关性得分,排序后选取若干高分第二文档补入所述候选文档集合。在其中一种可能的实现方式中,所本文档来自技高网...

【技术保护点】
1.一种推理问答方法,其特征在于,包括:/n根据输入问题在知识库中启发式检索出包含解答相关线索的目标文档;/n基于所述目标文档构建相应的图结构;/n结合所述输入问题、所述目标文档、所述图结构以及预设的推理解答策略,预测并输出答案。/n

【技术特征摘要】
1.一种推理问答方法,其特征在于,包括:
根据输入问题在知识库中启发式检索出包含解答相关线索的目标文档;
基于所述目标文档构建相应的图结构;
结合所述输入问题、所述目标文档、所述图结构以及预设的推理解答策略,预测并输出答案。


2.根据权利要求1所述的推理问答方法,其特征在于,所述根据输入问题在知识库中启发式检索出包含解答相关线索的目标文档包括:
利用多轮相关性计算以及实体提取策略,从知识库中筛选出包含解答相关线索的若干候选文档;
结合所述输入问题,对所述候选文档进行相关性重估;
根据重估结果进行重排序,并选取若干高分候选文档作为所述目标文档。


3.根据权利要求2所述的推理问答方法,其特征在于,所述利用多轮相关性计算以及实体提取策略,从知识库中筛选出包含解答相关线索的若干候选文档包括:
计算知识库中各第一文档相对于所述输入问题的相关性得分;
根据相关性得分,排序后选取若干高分第一文档构建候选文档集合;
从所述候选文档集合内的第一文档中提取若干实体;
在知识库中检索出与所述实体相关的第二文档;
计算各所述第二文档相对于所述输入问题的相关性得分;
根据相关性得分,排序后选取若干高分第二文档补入所述候选文档集合。


4.根据权利要求2所述的推理问答方法,其特征在于,所述结合所述输入问题,对所述候选文档进行相关性重估包括:
基于预设的语义表示策略,将所述输入问题的信息嵌入到各所述候选文档中,得到包含了上下文信息的各所述候选文档的各单词表示;
根据所述单词表示,重新计算各所述候选文档的相关性得分。


5.根据权利要求1所述的推理问答方法,其特征在于,所述基于所述目标文档构建相应的图结构包括:
识别出所述目标文档中的命名实体;
将所述命名实体以及所述目标文档中的语句作为节点,并基于预设的共现关联策略,构建异构图。


6.根据权利要求5所述的推理问答方法,其特征在于,所述共现关联策略包括如下一或多种:
相同命名实体之间建立连接关系;
每个命名实体与处于同一语句中的其他命名实体建立连接关系;
每个命名实体与所在语句建立连接关系;
每个语句与其相邻的前后语句建立连接关系;
任意两个语句中若存在相互连接的命名实体,此两个语句建立连接关系。


7.根据权利要求1所述的推理问答方法,其特征在于,所述推理解答策略包括:
将全部所述目标文档拼接为线索字符串;
基于预设的语义表示策略,将所述输入问题的信息嵌入到所述线索字符串,得到包含了上下文信息的所述线索字符串的各单词表示;
利用所述单词表示对所述图结构中相应的节点进行编码;
对编码后的节点进行迭代计算,建立节点之间的推理关系。


8.根据权利要求7所述的推理问答方法,其特征在于,所述对编码后的节点进行迭代计算,建立节点之间的推理关系包括:
将与所述输入问题相关的节点作为起始节点;
计算所述起始节点与各相邻节点间的注意力得分;
由所述起始节点与得分最高的相邻节点形成单步推理后的推理链;
将所述得分最高的相...

【专利技术属性】
技术研发人员:邵楠崔一鸣王士进胡国平刘挺
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1