基于多粒度图推理的多跳问答系统及推理方法技术方案

技术编号：40943847 阅读：2 留言：0更新日期：2024-04-18 15:01

本发明专利技术公开了一种基于多粒度图推理的多跳问答系统及推理方法，通过对多跳问答的问题和上下文建立不同粒度表示，使得问题和答案之间更好的建立联系，从而可以在多个分散段落中对分散的证据聚合线索。对不同粒度级别进行分层处理，将实际的问题、相关段落、相关的句子以及关键词构建成相关节点，通过逐步更新初始节点，以及在不同节点间添加并更新边缘表示，进而提取线索，实现多跳问答的可推理和可解释。更新节点及边缘关系后，同时生成一个答案实体，与预测的答案进行匹配，匹配值最高的为最终的答案。在中间每一跳推理中，都基于当前支持事实，使得整个多跳推理过程更加准确、更加可解释、更加稳健。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种多跳问答推理系统和方法，尤其涉及一种基于多粒度图推理的多跳问答系统及推理方法，属于信息处理。

技术介绍

1、在自然语言处理中，问答问题是举足轻重的一环。问答问题旨在测试人工智能系统的推理能力，一直以来都是各大科研机构研究的重点。目前，可解释的多跳问答需要系统能够同时返回答案以及相关依据句子。多跳问答(multi-hop qa)有难以推理和可解释性差这两大挑战。难以推理这一挑战需要从多个离散的文本中寻找证据并进行推理非常困难；可解释性这一挑战，用于推理的证据不一定位于答案附近，因此用户很难验证答案。另外很难抽取到证据，因为一般问题本身可能没有用提供相关线索，甚至证据之间可能存在依赖。例如证据2是依赖于证据才可以发现的。多跳阅读理解问答要求阅读和推理多个段落。2019年sewon min等人在annual meeting oftheassociation for computationallinguistics发表论文"compositional questions do not necessitate multi-hopreasoning",引入了一个单跳bert-based rc模型，该模型可以达到67的f1值，与最先进的多跳模型相当。他们还设计了一个评估设置，在这个设置中，人类不会看到预期的多跳推理的所有必要段落，但仍然可以回答超过80％的问题。

2、与单跳机器阅读理解相比，单跳机器阅读理解可以通过简单地匹配跨度来回答问题，多跳推理需要模型基于桥接信息来回答复合问题。多跳阅读理解需要在多个文本证据

3、目前很多研究员探索了一种基于对抗性段落选择的收集干扰的替代方法。虽然这似乎缓解了问题，但在这些干扰上重新训练的单跳模型可以恢复原始单跳精度的大部分表明这些干扰仍然不够。另一种方法是考虑非常大的干扰集，如所有维基百科或整个web，就像在开放域hotpotqa和complexwebquestions中所做的那样。然而，这引入了额外的计算挑战或对检索系统的需求。因此寻找一组能诱导多跳推理的干扰因素仍然是一个开放的挑战，值得进行后续工作。问题的组合性不是多跳推理的充分条件。相反，未来的数据集必须仔细考虑它们提供的证据，以确保需要多跳推理。至少有两种不同的方法来实现这一点。由于多跳问题的标准tf-idf检索的不足，他们的单跳模型在开域环境中很困难，因此建议未来的工作可以探索更好的多跳问题检索方法。另一种确保多跳推理的方法是选择强干扰，未来的多跳推理数据集可以开发改进的干扰收集方法。通过将困难的问题分解为现有的问答系统可以回答的更简单的子问题来改善问题的回答。kosuke nishida等人在arxiv:computation and language发表论文"answering while summarizing:multi-tasklearning for multi-hop qa with evidence extraction"提出qfe模型用于对证据进行抽取，并采用多任务学习进行训练，这使得qfe可以考虑到不同的证据句子之间的关系以及与问题重要相关的信息。yang等人在empirical methods in natural languageprocessing发表论文"hotpotqa:a dataset for diverse,explainable multi-hopquestion answering."，发布了一个可解释的多跳问答数据集hotpotqa，为监督学习提供答案的证据句。多跳质量保证中的证据提取比其他质量保证问题更为困难，因为问题本身可能不提供寻找证据句的线索。能够明确地提取证据的能力是应对难以推理和解释性差这两个挑战的一个进步。

4、目前的方法仍然存在一些局限性。首先，上述方法在图更新的每一步都同步地执行消息传递，忽略了不同级别的关系具有不同的优先级以及推理需要遵循有序逻辑的事实。如果推理没有有效地按照某种细粒度的逻辑顺序进行，模型很容易被干扰器误导，这种情况在以前的工作中被忽略了。

技术实现思路

1、本专利技术要解决的技术问题是提供一种基于多粒度图推理的多跳问答系统及推理方法。

2、为解决上述技术问题，本专利技术采用的技术方案一是：

3、一种基于多粒度图推理的多跳问答系统，由依次级联的图构建模块、上下文编码、图推理模块和多任务预测组成。

4、本专利技术采用的技术方案二是：

5、一种应用技术方案一所述基于多粒度图推理的多跳问答系统的推理方法，包括以下步骤：

6、步骤1、构建数据集

7、数据集包含一个以上的数据单元，各数据单元包括问题、支持事实、答案、上下文；其中，上下文由一个以上上下文段落组成；各上下文段落均包括一个以上句子；

8、步骤2、上下文排序

9、逐一对各数据单元中上下文段落按照与问题的相关性进行排序，并选择相关性高于预设相关阈值的上下文段落构建黄金段落集；

10、步骤3、建立多跳关系

11、逐一建立各数据单元中的问题与上下文段落的多跳关系，由以下具体步骤组成：

12、步骤3-1、确定匹配标题

13、将问题、上下文、支持事实划分实体，选择问题的一个实体作为匹配标题；

14、步骤3-2、建立下一跳关系

15、依次在黄金段落集中的上下文段落进行匹配；如果匹配成功，问题与匹配到的上下文段落建立下一跳关系，转向步骤3-4；否则，转向步骤3-3；

16、步骤3-3、更换匹配标题

17、根据支持事实转换匹配标题；转向步骤3-2；

18、步骤3-4、判断是否达到预设结束条件，如果是，转向步骤4，否则，转向步骤3-2；

19、步骤4、构建多跳推理图

20、以问题、上下文段落、句子、实体为节点；各上下文段落之间依据多条关系建立边，各上下文段落与本上下文段落的句子和其下一跳关系的上下文段落中的句子建立边，同一上下文段落中的句子间建立边，不同上下文段落中包含相同实体的句子间建立边；同一句子中的实体之间建立边；

21、步骤5、图训练

22、将数据集的问题和答案输入多跳推理图，训练图推理模型；

23、步骤6、图推理

24、将问题输入图推理模型，得到问题答案。

25、进一步，步骤1使用2018年公开的多跳推理数据集hotpotqa作为数据集。

26、进一步，步骤2使用bert网络计算问题与上下文段落的相关性。

27、进一步，步骤5将问题与黄金段落集中的上下文段落连接成为上下文c，并输入到预先训练的transformer roberta中，并使本文档来自技高网...

【技术保护点】

1.一种基于多粒度图推理的多跳问答系统，其特征在于，由依次级联的图构建模块、上下文编码、图推理模块和多任务预测组成。

2.一种用于权利要求1所述的基于多粒度图推理的多跳问答系统的推理方法，其特征在于，包括以下步骤：

3.根据权利要求2所述的推理方法，其特征在于，所述步骤1使用2018年公开的多跳推理数据集HotpotQA作为数据集。

4.根据权利要求2所述的推理方法，其特征在于，所述步骤2使用BERT网络计算问题与上下文段落的相关性。

5.根据权利要求2所述的推理方法，其特征在于，所述步骤5将问题与黄金段落集中的上下文段落连接成为上下文C，并输入到预先训练的Transformer RoBERTa中，并使用双注意层对其进行编码，之后输入多跳推理图。

6.根据权利要求5所述的推理方法，其特征在于，所述上下文C编码为：

7.根据权利要求5所述的推理方法，其特征在于，所述上下文C输入BigBird模型，标记为由l个子词组成的子词上下文表示C′：

8.根据权利要求6所述的推理方法，其特征在于，所述上下文C输

...

【技术特征摘要】

1.一种基于多粒度图推理的多跳问答系统，其特征在于，由依次级联的图构建模块、上下文编码、图推理模块和多任务预测组成。

2.一种用于权利要求1所述的基于多粒度图推理的多跳问答系统的推理方法，其特征在于，包括以下步骤：

3.根据权利要求2所述的推理方法，其特征在于，所述步骤1使用2018年公开的多跳推理数据集hotpotqa作为数据集。

4.根据权利要求2所述的推理方法，其特征在于，所述步骤2使用bert网络计算问题与上下文段落的相关性。

5.根据权利要求2所述的推理方法，其特征在...

【专利技术属性】
技术研发人员：赵书良，吴慧霞，
申请(专利权)人：河北师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人