情境感知的双重注意力自然语言推理方法技术

技术编号：20363532 阅读：57 留言：0更新日期：2019-02-16 16:49

本发明专利技术公开了一种情境感知的双重注意力自然语言推理方法，针对具有情境信息的自然语言句子对，运用多模态学习的方法和注意力机制，充分利用了文本，图像的信息，从而更准确理解句子所表达的语义以及在这样的语义下两个句子之间的交互，进而准确判断两个句子之间是否存在推理关系，同时还可以提供一种进行句子语义表征的方法，弥补了现有方法没有考虑句子所处的情境的弊端。

全部详细技术资料下载

【技术实现步骤摘要】
情境感知的双重注意力自然语言推理方法
本专利技术涉及深度学习和自然语言理解
，尤其涉及一种情境感知的双重注意力自然语言推理方法。
技术介绍
自然语言推理(NaturalLanguageInference,NLI)是自然语言理解领域的一个重要组成部分，要解决的主要问题是判断是否可以从前提句子(PremiseSentence)推断出假设句子(HypothesisSentence)。因此自然语言推理要解决的一个首要问题是句子语义的理解，这有助于机器理解人类表达同一种意义的多种表达方式；其次，相对于自然语言理解领域的其他问题，例如对话系统，问答系统等不仅需要理解语义，同时需要兼顾生成过程中的可靠性和稳定性，自然语言理解专注于句子语义理解，这不仅保证相关技术的语义理解质量，同时相关技术可以便捷的迁移到其他场景，例如对话系统，问答系统中。因此，自然语言推理一直是自然语言理解领域探索的一个重要研究方向。目前，关于自然语言推理的方法主要有以下方法：1)基于句子表示的方法基于句子表示的方法主要是通过不同的神经网络结构，例如卷积神经网络(ConvolutionalNeuralNetwork，CNN)，循环神经网络(RecurrentNeuralNetwork，RNN)等抽取句子的特征信息，然后将这些特征信息映射到低维空间，得到句子表示的向量，最后通过一些分类方法判断两个句子之间的推理关系。2)基于词匹配的方法相对于基于句子表示的方法，词匹配的方法更关于两个句子中的词之间的匹配关系，通过注意力机制(AttentionMechanism)或者门结构(GateUnit)等方法...

【技术保护点】
1.一种情境感知的双重注意力自然语言推理方法，其特征在于，包括：获取具有异构数据的包含情境信息的图像和对应的自然语言句子对；根据获取到的异构数据的图像和自然语言句子使用多模态学习的方法和注意力机制进行建模，获取自然语言句子对在图像注意力层的语义表示；根据自然语言句子对在图像注意力层的语义表示，使用注意力机制和循环神经网络进行建模，获取自然语言句子对在句子注意力层的语义表示；根据自然语言句子对在图像注意力层及句子注意力层的语义表示，利用自然语言推理中的匹配方法处理得到自然语言句子对的表示向量，以此判断自然语言句子对中两个句子之间是否存在推理关系。

【技术特征摘要】
1.一种情境感知的双重注意力自然语言推理方法，其特征在于，包括：获取具有异构数据的包含情境信息的图像和对应的自然语言句子对；根据获取到的异构数据的图像和自然语言句子使用多模态学习的方法和注意力机制进行建模，获取自然语言句子对在图像注意力层的语义表示；根据自然语言句子对在图像注意力层的语义表示，使用注意力机制和循环神经网络进行建模，获取自然语言句子对在句子注意力层的语义表示；根据自然语言句子对在图像注意力层及句子注意力层的语义表示，利用自然语言推理中的匹配方法处理得到自然语言句子对的表示向量，以此判断自然语言句子对中两个句子之间是否存在推理关系。2.根据权利要求1所述的一种情境感知的双重注意力自然语言推理方法，其特征在于，所述自然语言句子对包括：前提句子与假设句子；所述前提句子和假设句子的推理关系由专家标注，对应的情境信息的图像由文本数据时自动获得。3.根据权利要求1所述的一种情境感知的双重注意力自然语言推理方法，其特征在于，所述根据获取到的异构数据的图像和自然语言句子使用多模态学习的方法和注意力机制进行建模，获取自然语言句子对在图像注意力层的语义表示包括：使用统一的数学形式表示包含情境信息的图像和对应的自然语言句子对：对于图像，用I表示，是一个固定大小的三通道图，且每一个像素值在0到255之间；对于自然语言句子对中的前提句子用表示其由m个词组成的文本；对于自然语言句子对中的假设句子用表示其由n个词组成的文本；其中，Sa与Sb中的每一元素均表示一个词；对于图像表示，利用深度网络模型VGG或者残差网络模型ResNet处理，模型的最后一个卷积层的结果作为图像的特征表示，用c表示；Sa与Sb中的所有的不重复的词组成整个文本的词典V，词典V中每个词的向量表示由利用整个文本数据预训练好的自编码器得到，所有词的向量表示集合由E表示；再利用由自编码器得到每个词的低维向量表示，并且将这些信息融入到向量表示当中，由如下公式表示：门结构循环网络GRU分别对前提句子和假设句子进行建模，得到每个句子中的每个词的隐含状态序列hi表示，这样可以得到在考虑周围上下文的条件下每个词的深层语义表示，从而得到更加全面的句子语义理解，对于t时刻的输入xt，GRU的隐含状态ht更新如下：z＝σ(xtUz+ht-1Wz)r＝σ(xtUr+ht-1Wr)其中，z,r,cm分别是GRU的更新门，重置门，记忆单元，Uz与Wz为更新门的参数矩阵，Ur与Wr为重置门的参数矩阵，Uh与Wh为记忆单元的参数矩阵，表示点乘；xt表示前提句子Sa或假设句子Sb中第t个词的低维向量表示；利用GRU编码每个句子中每个词的表示，得到每个句子中词之间相互依赖的隐层表示，公式如下...

【专利技术属性】
技术研发人员：陈恩红，刘淇，张琨，吕广奕，吴乐，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人