一种融合卷积神经网络和循环神经网络的问答方法及系统技术方案

技术编号：20484969 阅读：27 留言：0更新日期：2019-03-02 19:00

本发明专利技术公开了一种融合卷积神经网络和循环神经网络的问答方法及系统，方法包括：根据用户输入的问句，获取问句的实体以及实体的查询ID；根据实体将问句简化成问句模式；根据查询ID收集实体的相关属性，生成候选属性列表；将问句模式以及候选属性列表输入预先训练好的属性判别器中，获取每个候选属性与问句的得分；根据得分判定与问句最相近的属性关系，取出最相近的属性关系的属性值完成回答。本发明专利技术利用字典树的方法实现快速的实体定位，可以满足高并发的商业系统，且可以减少无谓的字符串比较，提高查询效率，通过基于神经网络的方法进行属性推断，利用向量化的数值计算不需要人工整理模板，能够有效解决人工整理的操作繁杂以及不完备等问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合卷积神经网络和循环神经网络的问答方法及系统
本专利技术涉及信息检索
，特别涉及一种融合卷积神经网络和循环神经网络的问答方法及系统。
技术介绍
问答系统(QuestionAnswering，QA)是机器学习和人工智能领域长期研究的问题之一。最有名的故事就是IBMWatson在2011年参加Jeopardy竞赛，打败了所有人类竞争对手，获得了100万美元奖励。近些年，许多大型的通用知识图谱相继推出，比如YAGO、Freebase、NELL、DBpedie、zhishi.me等等。如何利用知识图谱结构化存储的知识进行问答成为了当下研究的热点。知识问答(也称知识库问答，知识图谱问答，简称KBQA)是指给定自然语言问题，通过对问题的语义解析和理解，进而利用知识图谱查询、推理得出答案。KBQA一般来说是以知识库里面的知识作为答案的来源。在一个知识库中存在大量三元组，例如(上海市，人口，2400万)表示上海市人口是2400万。每一个三元组是一个事实或者知识。现有的知识问答系统里面有两个难点：实体定位和属性推断。实体定位，即提取出问句中所提及实体(entitymention)，现在比较主流的做法是对问句进行语义解析(sematicparser)和实体识别(entityrecognition)得到实体词，再与知识库中实体进行匹配查询。但是，这种做法会有许多无谓的字符串比较，导致查询效率较低等问题。属性推断，即把一个问句映射到相应的实体属性上去，解析问题在对哪一个属性进行发问。如在“上海市有多少人？”这例子中，属性推断要准确推断出是对“上海市”这个实体的“人口”...

【技术保护点】
1.一种融合卷积神经网络和循环神经网络的问答方法，其特征在于，所述方法包括如下步骤：S1：根据用户输入的问句，获取所述问句的实体以及所述实体的查询ID；S2：根据所述实体将所述问句简化成问句模式；S3：根据所述查询ID收集所述实体的相关属性，生成候选属性列表；S4：将所述问句模式以及所述候选属性列表输入预先训练好的属性判别器中，获取每个候选属性与问句的得分；S5：根据所述得分判定与所述问句最相近的属性关系，取出所述最相近的属性关系的属性值完成回答。

【技术特征摘要】
1.一种融合卷积神经网络和循环神经网络的问答方法，其特征在于，所述方法包括如下步骤：S1：根据用户输入的问句，获取所述问句的实体以及所述实体的查询ID；S2：根据所述实体将所述问句简化成问句模式；S3：根据所述查询ID收集所述实体的相关属性，生成候选属性列表；S4：将所述问句模式以及所述候选属性列表输入预先训练好的属性判别器中，获取每个候选属性与问句的得分；S5：根据所述得分判定与所述问句最相近的属性关系，取出所述最相近的属性关系的属性值完成回答。2.根据权利要求1所述的融合卷积神经网络和循环神经网络的问答方法，其特征在于，所述步骤S1具体包括：根据用户输入的问句，利用预先构建的字典树对所述问句进行实体定位，匹配出所述问句的实体以及所述实体对应的查询ID。3.根据权利要求1或2所述的融合卷积神经网络和循环神经网络的问答方法，其特征在于，所述步骤S3具体包括：根据所述查询ID，在预先构建的知识图谱中查询并取出与所述实体连接的所有属性关系，生成候选属性列表。4.根据权利要求1或2所述的融合卷积神经网络和循环神经网络的问答方法，其特征在于，所述步骤S4具体包括：S4.1：利用循环神经网络对所述问句进行语义建模，并根据每个候选属性加入注意力机制获取语义特征向量；S4.2：利用卷积神经网络对所述问句进行字词相似性建模获取字词特征向量；S4.3：结合所述语义特征向量和字词特征向量，通过线性神经网络获取每个候选属性与问句的得分。5.根据权利要求4所述的融合卷积神经网络和循环神经网络的问答方法，其特征在于，所述步骤S4.1具体包括：S4.1.1：对所述问句和候选属性进行分词，根据预先构建的词向量库获取所述问句对应的词向量以及所述候选属性对应的关系向量，并将所述词向量拼接成句向量；S4.1.2：将所述句向量输入到循环神经网络中，将输出拼接成包含前后语义关系的新的句子；S4.1.3：将所述新的句子乘以注意力权重向量，获取针对于所述候选属性的新的句子表示；S4.1.4：根据所述新的句子表示与所述关系向量，获取所述候选属性的语义特征向量。6.根据权利要求5所述的融合卷积神经网络和循环神经网络的问答方法，其特征在于，所述步骤S4.2具体包括：S4.2.1：根据所述问句对应的词向量以及所述候选属性对应的关系向量做相似计算，获取两两相似得分组成的相似矩阵；S4.2.2：将所述相似矩阵输入卷积神经网络，通过计算，获取字词特征向量。7.一种融合卷积神经网络和循环神经网络的问答系统，...

【专利技术属性】
技术研发人员：李勇，张发幼，周建华，
申请(专利权)人：众安信息技术服务有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人