一种自然语言推理的神经网络架构制造技术

技术编号：21142191 阅读：32 留言：0更新日期：2019-05-18 05:28

本发明专利技术公开了一种自然语言推理的神经网络架构，其特点是采用知识库、知识吸收门和语义关系预测架构的卷积神经网络，所述知识库中的每个知识以三元组表示；所述知识吸收门为上、下文感知的集合；所述卷积神经网络由前提句向量表示、假设句向量表示和句子间信息交互组成；所述语义关系预测基于句子交互后的信息对自然语言所表达的信息进行推理，并对两句子之间的语义关系进行预测。本发明专利技术与现有技术相比具有外部知识融入神经网络的特点，使引入的相关知识与句子表示结合，语义推理更准确，方法简便、高效，成本低廉，并且能够在不同数据领域之间进行迁移，具有广泛的实用意义，能够为智能问答系统、文本摘要系统等应用提供有效的解决方案。

全部详细技术资料下载

【技术实现步骤摘要】
一种自然语言推理的神经网络架构
本专利技术涉及自然语言推理
，尤其是一种带外部知识的自然语言推理的神经网络架构。
技术介绍
感知和推理是人类和人工智能的核心，自然语言的推理是将前提和假设两句子的语义关系分为蕴含、矛盾和中立三类，具体而言，自然语言推理旨在确定给定的假设句是否可以从给定的前提句中通过逻辑推断出。例如，以“乔布斯创立苹果”为前提句，我们可以推断“乔布斯是苹果的创始人”这一假设句是真实的，因此我们将前提句与假设句之间的关系标记为“蕴含”。自然语言推理是评估模型语言理解能力的重要任务，因此，对问答系统、抽象文本摘要以及图像标注等自然语言处理是很有帮助和有益的。最近发布的大规模数据集，如斯坦福自然语言推理语料(SNLI)和多种类自然语言推理语料库(MultiNLI)，使得自然语言推理任务更加可行和准确。根据模型是否能够利用两句话之间的交互信息，所提出的模型可以分为基于编码的模型和使用交叉句子特征的交互式模型，基于编码的模型为单独编码前提和假设。现有技术的自然语言推理通常依赖于逻辑规则和手工构建的特征，这些特征耗费劳动力且难以泛化，很少研究关注融合外部词汇知识。基于神经网络的模型也只是端到端训练，输入只是文本或一系列词汇，而忽视了大量的背景知识，如前提为“今天下雨了，她很伤心”，假设为“她今天很快乐”的“SNLI”数据集例子，如果计算机无法从大量注释数据中学习有用或足够的信息来建模“伤心”和“快乐”的关系，也就是很难正确预测前提与该假设是相矛盾的关系。
技术实现思路
本专利技术的目的是针对现有技术的不足而设计的一种自然语言推理的神经网络架构，采用知库...

【技术保护点】
1.一种自然语言推理的神经网络架构，其特征在于采用知识库、知识吸收门和语义关系预测架构的卷积神经网络系统，所述知识库采用“WordNet”和“Wikidata”知库，其库中的每个知识均以u＝(head(h)，relation(r)，tail(t))的三元组表示；其中，h和t是实体；r则是这两个实体之间的关系；所述知识吸收门表示为G＝{gi}(i＝1,2,…)的上、下文感知的集合；所述卷积神经网络由前提句向量表示、假设句向量表示和句子间信息交互组成；所述前提句向量表示和假设句向量表示采用长短时记忆网络“LSTM”对前提X和假设Y进行编码，分别得到基于上、下文的句子向量表示；所述句子间信息交互为编码后的知识融入前提句和假设句的向量表示中进行句子间的信息交互；所述语义关系预测基于句子交互后的信息对自然语言所表达的信息进行推理，并对两句子之间的语义关系进行预测。

【技术特征摘要】
1.一种自然语言推理的神经网络架构，其特征在于采用知识库、知识吸收门和语义关系预测架构的卷积神经网络系统，所述知识库采用“WordNet”和“Wikidata”知库，其库中的每个知识均以u＝(head(h)，relation(r)，tail(t))的三元组表示；其中，h和t是实体；r则是这两个实体之间的关系；所述知识吸收门表示为G＝{gi}(i＝1,2,…)的上、下文感知的集合；...

【专利技术属性】
技术研发人员：杨燕，张琪，陈成才，贺樑，
申请(专利权)人：华东师范大学，上海智臻智能网络科技股份有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人