一种基于端到端记忆网络的问答方法技术

技术编号：19122093 阅读：15 留言：0更新日期：2018-10-10 05:12

本发明专利技术公开了一种基于端到端记忆网络的问答方法，本方法为：1)对目标数据集进行划分，将该目标数据集中的已知事实、问题和答案分割开并存储；2)将所述已知事实中的每个句子xi转换为词向量；3)将问题转换为词向量，计算每一句子xi对应的词向量mi与问题的词向量的相关度，得到对应句子xi的权重值pi；4)提取问题中的关键词；检索包含关键词的词向量，对于搜索到的每一词向量mi，计算mi中每个单词与关键词的相关度，作为第j个单词的权重；mi中每个单词加权后的向量记为向量ci；5)计算MemN2N模型中每层网络的输出；6)根据MemN2N模型的最终输出作为问题的答案。本发明专利技术大大提升了实问答的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于端到端记忆网络的问答方法
本专利技术涉及自然语言处理领域和端到端记忆网络(End-to-EndMemoryNetworks)，具体是一种基于端到端记忆网络的问答方法。
技术介绍
2011年，IBM因为推出名为Watson的计算机而受到广泛关注，Watson被设计用来回答游戏节目Jeopardy上的问题，它的表现非常好，足以和最好的玩家相匹敌。想让Watson跟最好的玩家竞争，需要集成大量的知识，而且需要用到很多自然语言处理领域最好的研究成果和大量的人工智能技术。从此，问答系统(Question-Answersystem，QAsystem)便获得了广大研究者的广泛关注。传统的问答系统是人工智能领域的一个应用，通常局限于一个非常狭窄的领域，虽然精巧，但大多由人工编制的知识库加上一个自然语言接口形成，本质上都属于受限于实验室的玩具系统(ToySystem)。随着互联网的发展以及搜索引擎的普及，一些具有商业应用价值的开放式问答系统应运而生。目前开放式问答系统主要分为两类：基于信息检索(InformationRetrievalBased)的系统和基于语义分析(SemanticParsingBased)的系统。基于信息检索的系统首先将问题转化为有效的查询，然后获取大量的候选答案，再通过对候选答案进行打分排序，得到最后的答案；而基于语义分析的系统更侧重于通过语义分析系统来获取问题的精准释义，然后从知识库中获取正确答案。随着深度学习的发展，研究者们开始探索如何实现一种端到端训练的问答系统模型。2015年，Facebook人工智能实验室提出一种新颖的基于循环神经网络...
一种基于端到端记忆网络的问答方法

【技术保护点】
1.一种基于端到端记忆网络的问答方法，其步骤包括：1)对目标数据集进行划分，将该目标数据集中的已知事实、问题和答案分割开并存储；2)将所述已知事实中的每个句子xi转换为词向量并存储到Memory模块中；3)将所述问题转换为词向量，计算Memory中每一句子xi对应的词向量mi与所述问题的词向量的相关度，得到对应句子xi的权重值pi；4)提取所述问题中的关键词key；在Memory模块中检索包含所述关键词key的词向量，对于搜索到的每一词向量mi，计算该词向量mi中每个单词与所述关键词key的相关度，作为第j个单词的权重pij_key；该词向量mi中每个单词加权后的向量记为向量ci；5)计算MemN2N模型中每层网络的输出o＝∑i(pi+pij_key*Axij)*ci；其中，Axij表示句子xi中第j个单词的词向量；如果MemN2N模型为单层网络，则o即为MemN2N模型的输出；如果MemN2N模型为多层网络，则计算uk+1＝ok+uk+keyn作为第k+1层的输入；其中，keyn表示第n个关键词key的词向量，ok为第k层网络的输出，uk为第k层网络的输入，uk+1为第k+1层网络的...

【技术特征摘要】
1.一种基于端到端记忆网络的问答方法，其步骤包括：1)对目标数据集进行划分，将该目标数据集中的已知事实、问题和答案分割开并存储；2)将所述已知事实中的每个句子xi转换为词向量并存储到Memory模块中；3)将所述问题转换为词向量，计算Memory中每一句子xi对应的词向量mi与所述问题的词向量的相关度，得到对应句子xi的权重值pi；4)提取所述问题中的关键词key；在Memory模块中检索包含所述关键词key的词向量，对于搜索到的每一词向量mi，计算该词向量mi中每个单词与所述关键词key的相关度，作为第j个单词的权重pij_key；该词向量mi中每个单词加权后的向量记为向量ci；5)计算MemN2N模型中每层网络的输出o＝∑i(pi+pij_key*Axij)*ci；其中，Axij表示句子xi中第j个单词的词向量；如果MemN2N模型为单层网络，则o即为MemN2N模型的输出；如果MemN2N模型为多层网络，则计算uk+1＝ok+uk+keyn作为第k+1层的输...

【专利技术属性】
技术研发人员：徐俊刚，王琦，
申请(专利权)人：中国科学院大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人