一种基于深度学习的候选答案选取方法技术

技术编号：20025740 阅读：40 留言：0更新日期：2019-01-06 04:35

本发明专利技术提供一种基于深度学习的候选答案选取方法，包括：步骤S1，输入问句和候选答案，分别解析为问句词序列和候选答案词序列；步骤S2，通过长短时记忆网络对问句词序列和候选答案词序列建模，得到问句的语义表示和候选答案的语义表示；步骤S3，选取问句词序列中权重值最高的词的词向量来初始化知识记忆模块；步骤S4，根据知识记忆模块中存储的知识信息和问句的语义表示，计算问句的知识表示；步骤S5，计算问句的知识表示与候选答案的语义表示之间的相似度，选取相似度最高的候选答案输出。本发明专利技术在深度学习网络中引入一个知识记忆模块来提高问句与候选答案之间的联系，提高答案选取的质量，以更好地应用于社区问答网站和问答系统中。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的候选答案选取方法
本专利技术涉及深度学习、问答系统和答案选取
，尤其涉及一种基于深度学习的候选答案选取方法。
技术介绍
随着人们对信息获取的准确性的需求提高，传统搜索技术不再能满足人们的需求。社区问答系统使得用户可以发布问题进行提问以满足自己的信息需求，同时可以与其他用户交流和分享自己的经验、知识和体会。社区问答系统中积累了大量的用户问答数据资源，如何利用好这些资源，更好地满足用户的信息需求是目前研究机构和工业界研究的一个主要问题。具体来说，用户在社区问答系统中新提交的问题需要等待其他用户的回答，也即需要一个“响应时间”才能得到需要的信息。为了及时得到所需信息，用户可以将其信息需求以查询问题的方式提交到社区问答的检索系统中，检索系统从系统所积累的历史问题答案库中检索出与查询问题在语义上相同或相似的问题，并将候选历史问题及其答案返回给用户。目前对于候选答案的查找主要分为两大方向，第一是传统的检索方法，主要是利用词型词义的及句法树信息的问句相似度匹配等算法。第二是深度学习方法，对语句的语义信息进行建模，学习为计算机可处理的结构，从而对问句的语义进行表示。我们的目标是设计更合理的模型对问句的语义信息进行精确表示，提高相似问句检索的性能。近年来深度学习方法被用来自动的从数据中抽取特征，最近的研究将问题看作是一系列词的序列，然后用递归神经网络(递归神经网络(RNN)是两种人工神经网络的总称，一种是时间递归神经网络(RecurrentNeuralNetwork)，另一种是结构递归神经网络(RecursiveNeuralNetwork))对其建模...

【技术保护点】
1.一种基于深度学习的候选答案选取方法，其特征在于，所述候选答案选取方法包括以下步骤：步骤S1，输入问句和候选答案，将输入的问句解析为问句词序列，将输入的候选答案解析为候选答案词序列；步骤S2，通过长短时记忆网络对问句词序列和候选答案词序列建模，得到问句的语义表示和候选答案的语义表示；步骤S3，选取问句词序列中权重值最高的词的词向量来初始化知识记忆模块，所述知识记忆模块中存储有多条知识信息；步骤S4，根据知识记忆模块中存储的知识信息和问句的语义表示，计算问句的知识表示；步骤S5，计算问句的知识表示与候选答案的语义表示之间的相似度，选取相似度最高的候选答案输出。

【技术特征摘要】
1.一种基于深度学习的候选答案选取方法，其特征在于，所述候选答案选取方法包括以下步骤：步骤S1，输入问句和候选答案，将输入的问句解析为问句词序列，将输入的候选答案解析为候选答案词序列；步骤S2，通过长短时记忆网络对问句词序列和候选答案词序列建模，得到问句的语义表示和候选答案的语义表示；步骤S3，选取问句词序列中权重值最高的词的词向量来初始化知识记忆模块，所述知识记忆模块中存储有多条知识信息；步骤S4，根据知识记忆模块中存储的知识信息和问句的语义表示，计算问句的知识表示；步骤S5，计算问句的知识表示与候选答案的语义表示之间的相似度，选取相似度最高的候选答案输出。2.如权利要求1所述的候选答案选取方法，其特征在于，步骤S2具体包括：步骤S21，将问句词序列中的词映射为对应的词向量，形成问句词向量集，将候选答案词序列中的词映射为对应的词向量，形成候选答案词向量集；步骤S22，将问句词向量集中的词向量逐一输入长短时记忆网络，计算问句的语义表示，将候选答案词向量集中的词向量逐一输入长短时记忆网络，计算候选答案的语义表示。3.如权利要求2所述的候选答案选取方法，其特征在于，所述长短时记忆网络包括复数个计算模块，所述计算模块的个数与所述问句词向量集中的词向量的个数，或者与所述候选答案词向量集中的词向量的个数匹配，每个词向量对应输入一个计算模块，每个计算模块输出一计算结果和一状态量，后一个计算模块以前一个计算模块的计算结果和状态量为输入，最后一个计算模块的计算结果作为问句的语义表示或者候选答案的语义表示。4.如权利要求3所述的候选答案选取方法，其特征在于，每个计算模块的计算公式为：it＝σ(Wixt+Uiht-1+bi)ft＝σ(Wfxt...

【专利技术属性】
技术研发人员：杨燕，安炜杰，贺樑，
申请(专利权)人：华东师范大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人