基于关系图卷积网络的推理型阅读理解方法技术

技术编号：24498740 阅读：94 留言：0更新日期：2020-06-13 04:07

本发明专利技术公开了一种基于关系图卷积神经网络的推理型阅读理解方法：该方法主要针对在文档间进行推理的阅读理解场景，首先根据问题和候选答案，在文档间挖掘推理路径，抽取推理节点；然后利用问题节点，候选答案节点和推理节点构建一个图网络作为文档和候选答案的表示；利用上下文词向量初始化图网络的节点向量；接着利用问题相关的门控机制优化图卷积网络的更新公式，更新图网络中节点的表示；最后利用双向注意力机制再次对问题和图网络进行交互编码，并通过全连接网络输出每个候选答案的概率。本发明专利技术提出了一个解决推理型阅读理解任务的方法，能够在多篇文档之间进行推理，可以有效的提高推理型阅读理解任务的效果，对阅读理解的发展具有较大的意义。

Inferential reading comprehension method based on convolution network of relation graph

全部详细技术资料下载

【技术实现步骤摘要】
基于关系图卷积网络的推理型阅读理解方法
本专利技术涉及基于关系图卷积网络的推理型阅读理解方法，特别是涉及一种包含推理路径的图卷积网络的选择式阅读理解，利用推理节点将推理路径的思想引入到图网络中，利用门控机制和注意力机制优化关系图卷积的更新方式，在推理过程中引入问题的信息。
技术介绍
阅读理解任务是指让机器像人一样，能够阅读文档，理解文档的意思，往往用关于文档的相关问题来验证机器理解文档的能力。阅读理解作为自然语言处理的一个重要任务，在最近几年成为学术和工业界的热点。在智能客服，自动问答系统有广泛的应用，能大大降低人工的劳动力，提高公司的效率。随着大数据，人工智能时代的到来，设计一个能够自动理解文档的阅读理解系统是非常有意义的，可以极大的促进人工智能的发展。早期的阅读理解模型主要受限于传统机器学习技术的缺陷和大规模数据集的缺失，随着深度神经网络的兴起和大规模数据集的构建，阅读理解任务在近几年发展迅速，成为学术界最炽手可热的研究热点。2015年Hermann等人提出了两个用于阅读理解任务的大规模数据集CNN和DailyM...

【技术保护点】
1.一种基于关系图卷积网络的推理型阅读理解方法，其特征在于，包括以下步骤：/n1)抽取问题节点和候选答案节点：首先利用实体识别工具抽取问题中的实体，然后在文档中寻找该实体，将找到的实体作为一个问题节点，不同的位置的实体做为问题不同的节点；对于候选答案节点，将每个候选答案当做一个实体，然后与问题中的实体做相同的操作形成候选答案节点；/n2)抽取推理节点：首先用实体识别工具抽取所有文档的实体；然后选取某一文档中包含问题节点的句子s

【技术特征摘要】
1.一种基于关系图卷积网络的推理型阅读理解方法，其特征在于，包括以下步骤：
1)抽取问题节点和候选答案节点：首先利用实体识别工具抽取问题中的实体，然后在文档中寻找该实体，将找到的实体作为一个问题节点，不同的位置的实体做为问题不同的节点；对于候选答案节点，将每个候选答案当做一个实体，然后与问题中的实体做相同的操作形成候选答案节点；
2)抽取推理节点：首先用实体识别工具抽取所有文档的实体；然后选取某一文档中包含问题节点的句子sq，找到句子sq中除问题节点q外的其他实体集m1，然后在其他文档找到另一个包含了m1中的某个实体e1的句子s1。判断句子s1中是否含有某个候选答案节点，如果存在某个候选答案节点c，则找到一条从问题节点q到候选答案节点c的路径为q→e1→c，其中问题节点与候选答案节点之间的节点为推理节点；如果句子s1中不存在任何候选答案节点，则继续找到s1句子中除实体e1外的其他实体集m2，重复上述过程，直到找到存在候选答案的句子；
3)基于推理路径的图网络构建：图网络的构建主要包含节点的确定和边关系的确定。首选以步骤1)和步骤2)抽取的问题节点，候选答案节点和推理节点作为图网络的节点，根据步骤2)中得到的路径添加不同的边关系形成图网络，以此来作为文档和候选答案的表示；
4)图网络的初始化：用步骤3)获得的图网络表示所有文档和候选答案，将所有文档通过深度上下文词向量表示模型(ELMo)，获得文档中每个词的上下文相关表示，然后抽取文档中对应图网络节点的词向量，与静态词向量组合作为图网络节点的初始化向量表示。
5)引入问题信息的关系图卷积更新：利用关系图卷积网络(RGCN)来更新步骤3)获得的图网络时，首先利用双向长短期记忆网络(BiLSTM)将问题编码为qrnn，然后利用关系图卷积公式获得图网络节点的更新表示为然后利用注意力机制和门控机制将qrnn引入到节点表示中，接着在利用一个门控机制结合上一时刻的节点表示和更新后的表示获得当前时刻的向量表示将该关系图卷积更新过程堆叠L层获得图网络的表示
6)基于双向注意力机制的交互编码：利用双向注意力机制对步骤5)得到的图网络的和qrnn进行交互，然后将交互后的向量拼接，形成节点最终的向量表示；
7)答案输出层：将步骤6)获得的节点向量表示，经过两层的全连接网络，输出每个候选答案的概率，选择概率最大的候选答案作为问题最终的答案。

2.根据权利要求1所述的基于关系图卷积网络的推理型阅读理解方法，其特征在于，所述的步骤1)中，在文档中寻找相应的实体时，将所有标点统一化，字符小写化，然后采用字符匹配的方式去匹配实体。

3.根据权利要求1所述的基于关系图卷积网络的推理型阅读理解方法，其特征在于，步骤1)中，所述候选答案为实体或者短语。

4.根据权利要求1所述的基于关系图卷积网络的推理型阅读理解方法，其特征在于，所述步骤2)中，实体识别工具采用斯坦福大学提供的stanfordcorenlp工具包，并过滤掉日期，数字等无意义的实体。

5.根据权利要求1所述的基于关系图卷积网络的推理型阅读理解方法，其特征在于，所述步骤3)中，所述图网络中的边关系具有以下6类，分别为：
a)为问题中的实体节点和与它出现在同一个句子中的推理节点添加一种边关系；
b)为出现在同一个推理路径中邻接的推理节点添加一种边关系；
c)为候选答案的节点和与它出现在同一个句子中的...

【专利技术属性】
技术研发人员：鲁伟明，汤泽云，吴飞，庄越挺，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人