一种基于变量绑定和关系激活的自动问答方法技术

技术编号：16969586 阅读：24 留言：0更新日期：2018-01-07 06:33

本发明专利技术属于自然语言处理领域，具体涉及一种基于变量绑定和关系激活的自动问答方法。旨在解决现有技术难以模拟人脑精确推理出结果的问题。本发明专利技术的方法包括对文本和问句进行编码，得到文本的语义信息和问句的查询语句，识别文本中的实体，并对实体进行映射和跟踪，利用第一动作网络理解语义信息，确定实体在逻辑规则中的位置，利用第二动作网络激活实体关系，将实体关系写入逻辑规则，得到意象图式，利用查询语句对意象图式进行检索，根据检索结果生成答案词。本发明专利技术将实体位置和实体关系写入逻辑规则之后形成意象图式，能够作为先验知识存在，无需依赖大量的数据，即可产生与人脑类似的变量和关系序列，产生正确答案。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于变量绑定和关系激活的推理方法
本专利技术属于自然语言处理领域，具体涉及一种基于变量绑定和关系激活的推理方法。
技术介绍
自动问答是自然语言处理中重要的组成部分，其表现形式通常为通过阅读文本，理解文本所包含的叙述段落，并针对段落内容给出的问句进行回答，自动问答需要能够精确理解文本中的概念和关系，并进行推理的能力。目前已有的自动问答方法是通过使用已有的命名实体识别、语义角色标注、句法分析工具得到句义表示，将句义表示代入逻辑规则，对段落中所有句子进行编码并直接存放，使用注意力机制进行多轮选择，生成答案词的连续表示，通过理解段落中的句子，并对段落进行记忆，选择有用的信息，对矩阵形式的外置记忆单元进行读写和寻址，从而完成对推理问题的问答。使用外置记忆单元和注意力机制的模型框架在自动问答时能够取得较好的效果，但是使用该模型框架对推理规则的理解所依赖的数据量过大，缺乏对概念范畴和对立关系(例如南、北)的先验知识，即使数据充分，也难以获得完全精确和类人的结果，当样本数量较少时，该模型框架在解决归纳演绎、位置推理等场景时存在很大的困难。以下述问题为例：1.Theredsquareisbelowthebluesquare.2.Theredsquareistotheleftofthepinkrectangle.问题1：Isthebluesquarebelowthepinkrectangle？问题2：Isthepinkrectangleabovethebluesquare？使用现有技术的自动问答方法，对于问题1和问题2的回答均为no，现有的自动问答方法难以理解上、下、左、...
一种<a href="http://www.xjishu.com/zhuanli/55/201710755961.html" title="一种基于变量绑定和关系激活的自动问答方法原文来自X技术">基于变量绑定和关系激活的自动问答方法</a>

【技术保护点】
一种基于变量绑定和关系激活的推理方法，其特征在于，包括：通过词向量和编码模型对文本进行编码，得到所述文本的语义信息；识别所述文本的语义信息中的实体，对所述实体进行映射和跟踪；通过第一动作网络理解所述语义信息和问句，确定所述实体在逻辑规则中的位置，得到所述问句对应的查询语句；通过第二动作网络激活实体关系，并将所述实体关系写入所述逻辑规则，得到意象图式；利用所述查询语句对所述意象图式进行检索，得到检索结果，根据所述检索结果生成答案词。

【技术特征摘要】
1.一种基于变量绑定和关系激活的推理方法，其特征在于，包括：通过词向量和编码模型对文本进行编码，得到所述文本的语义信息；识别所述文本的语义信息中的实体，对所述实体进行映射和跟踪；通过第一动作网络理解所述语义信息和问句，确定所述实体在逻辑规则中的位置，得到所述问句对应的查询语句；通过第二动作网络激活实体关系，并将所述实体关系写入所述逻辑规则，得到意象图式；利用所述查询语句对所述意象图式进行检索，得到检索结果，根据所述检索结果生成答案词。2.根据权利要求1所述的基于变量绑定和关系激活的推理方法，其特征在于，所述“通过词向量和编码模型对文本进行编码”，其方法为：将所述文本使用可训练的映射矩阵进行词向量表示，其中所述词向量作为所述文本的词粒度的编码，计算所述词向量ei(t)的具体公式为：其中，|V|表示总词表大小，d表示词向量的维度，A表示映射矩阵，xi,t表示t时刻的文本，表示实数构成的矩阵；使用编码模型将所述词向量拼接为句子向量，所述句子向量表示所述文本的语义信息，计算所述句子向量st的具体公式为：st＝concat(e1(t),e2(t),...en(t))，其中，concat表示字符串连接函数。3.根据权利要求2所述的基于变量绑定和关系激活的推理方法，其特征在于，所述编码模型为循环神经网络模型。4.根据权利要求3所述的基于变量绑定和关系激活的推理方法，其特征在于，所述“对所述实体进行映射和跟踪”，其方法为：使用命名空间为所述实体分配固定编号；当所述文本中出现相同的实体时，所述命名空间为所述相同的实体映射相同的编号。5.根据权利要求4所述的基于变量绑定和关系激活的推理方法，其特征在于，所述“通过第一动作网络理解所述语义信息和问句”之前，该方法还包括：使用全连接的感知机将所述句子向量进一步编码为隐层表示，其中，计算隐层语义ht的具体公式为：ht＝σ(Whidst)，其中，Whid表示神经网络权重，其中，dim(s)表示句子向量的维度，d表示词向量的维度，表示实数构成的矩阵，σ表示sigmoid激活函数，st表示句子向量。6.根据权利要求5所述的基于变量绑定和关系激活的推理方法，其特征在于，所述“确定所述实体在逻辑规则中的位置”，其方法为：使用全连接的感知机理解所述隐层语义，根据变量绑定的动作决策输出...

【专利技术属性】
技术研发人员：许家铭，姚轶群，石晶，徐波，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人