一种基于动态路由机制的机器阅读理解网络模型、方法、存储介质及终端技术

技术编号:22565209 阅读:21 留言:0更新日期:2019-11-16 12:04
本发明专利技术公开了一种基于动态路由机制的机器阅读理解网络模型、方法、存储介质及终端,它包括:基础编码层:用于完成对输入文本段落和问题序列的交互匹配式编码,并最终以向量序列的形式输出对输入信息的编码;路由解码层:用于接收来自所述基础编码层的向量序列,经过多层动态路由层解码映射成高级语义特征向量并进行适应性的轻微重编码后输出;输出层:将所述动态路由层输出的高级语义特征向量经过处理得到答案并输出;通过将动态路由机制引入到机器阅读理解的深度神经网络模型中,有效提高了模型对自然语言的理解和推理能力。

A network model, method, storage medium and terminal of machine reading comprehension based on dynamic routing mechanism

The invention discloses a machine reading and understanding network model, method, storage medium and terminal based on dynamic routing mechanism, which includes: basic coding layer: used to complete the interactive matching coding of input text paragraph and problem sequence, and finally output the coding of input information in the form of vector sequence; routing decoding layer: used to receive the information from the basic coding layer Vector sequence, which is decoded and mapped into high-level semantic feature vector by multi-layer dynamic routing layer, is output after adaptive slight recoding; output layer: the high-level semantic feature vector output by the dynamic routing layer is processed to get the answer and output; by introducing the dynamic routing mechanism into the deep neural network model of machine reading comprehension, the self-improvement of the model is effectively improved But language understanding and reasoning ability.

【技术实现步骤摘要】
一种基于动态路由机制的机器阅读理解网络模型、方法、存储介质及终端
本专利技术涉及语言处理
,尤其涉及一种基于动态路由机制的机器阅读理解网络模型、方法、存储介质及终端。
技术介绍
一般来说,人们在读完一篇文章之后就会在脑海里形成一定的印象,例如这篇文章讲的是什么人,做了什么事情,出现了什么,发生在哪里等等。人们能够很轻而易举地归纳出文章中的重点内容。机器阅读理解的研究就是赋予计算机与人类同等的阅读能力,即让计算机阅读一篇文章,随后让计算机解答与文中信息相关的问题。这种对人类而言轻而易举的能力,对计算机来说却并非如此。现目前对于自然语言处理的研究都是基于句子级别的阅读理解,例如给计算机一句话,理解句子中的主谓宾语、定状补语,谁做了什么事情等等。但是对于长文本中问题的阅读和理解一直是研究的一个难点,因为这涉及到句子和上下文之间的连贯性以及逻辑推理等更高维的研究内容,使得目前对这一块的研究还很空缺。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于动态路由机制的机器阅读理解网络模型、方法、存储本文档来自技高网...

【技术保护点】
1.一种基于动态路由机制的机器阅读理解网络模型,其特征在于:它包括:/n基础编码层:用于完成对输入文本段落和问题序列的交互匹配式编码,并最终以向量序列的形式输出对输入信息的编码;/n路由解码层:用于接收来自所述基础编码层的向量序列,经过多层动态路由层解码映射成高级语义特征向量并进行适应性的轻微重编码后输出;/n输出层:将所述动态路由层输出的高级语义特征向量经过处理得到答案并输出。/n

【技术特征摘要】
1.一种基于动态路由机制的机器阅读理解网络模型,其特征在于:它包括:
基础编码层:用于完成对输入文本段落和问题序列的交互匹配式编码,并最终以向量序列的形式输出对输入信息的编码;
路由解码层:用于接收来自所述基础编码层的向量序列,经过多层动态路由层解码映射成高级语义特征向量并进行适应性的轻微重编码后输出;
输出层:将所述动态路由层输出的高级语义特征向量经过处理得到答案并输出。


2.根据权利要求1所述的一种基于动态路由机制的机器阅读理解网络模型,其特征在于:所述路由解码层包括由多个动态路由层以级联的方式堆叠而成,每个动态路由层包括由一层胶囊网络层和一层双向LSTM层组成。


3.根据权利要求1所述的一种基于动态路由机制的机器阅读理解网络模型,其特征在于:所述胶囊网络层接收来自所述基础编码层的向量序列,并将这些携带问题序列和段落交互信息的编码向量解码映射成高级语义特征向量;所述双向LSTM层在阅读理解所述高级语义特征向量的基础上对所述高级语义特征向量进行适应性的轻微重编码。


4.一种基于动态路由机制的机器阅读理解方法,其特征在于:所述方法包括以下内容:
路由解码层中最底层的胶囊网络层接收来自基础编码层的向量序列,并将这些携带问题序列和段落交互信息的编码向量解码映射成高级语义特征向量;
双向LSTM层在阅读理解所有高级语义特征向量的基础上对高级语义特征向量进行适应性的轻微重编码;
重复步骤二和步骤三直到所有高级语义特征向量被映射提取以及轻微重编码后输入到输出层。


5.根据权利要求4所述的一种基于动态路由机制的机器阅读理解方法,其特征在于:还包括输入文本段落和问题序列到基础编码...

【专利技术属性】
技术研发人员:李晓瑜段艺文胡孙强黄海滔洪磊郑德生
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1