一种融合卷积神经网络和循环神经网络的问答方法及系统技术方案

技术编号:20484969 阅读:27 留言:0更新日期:2019-03-02 19:00
本发明专利技术公开了一种融合卷积神经网络和循环神经网络的问答方法及系统,方法包括:根据用户输入的问句,获取问句的实体以及实体的查询ID;根据实体将问句简化成问句模式;根据查询ID收集实体的相关属性,生成候选属性列表;将问句模式以及候选属性列表输入预先训练好的属性判别器中,获取每个候选属性与问句的得分;根据得分判定与问句最相近的属性关系,取出最相近的属性关系的属性值完成回答。本发明专利技术利用字典树的方法实现快速的实体定位,可以满足高并发的商业系统,且可以减少无谓的字符串比较,提高查询效率,通过基于神经网络的方法进行属性推断,利用向量化的数值计算不需要人工整理模板,能够有效解决人工整理的操作繁杂以及不完备等问题。

【技术实现步骤摘要】
一种融合卷积神经网络和循环神经网络的问答方法及系统
本专利技术涉及信息检索
,特别涉及一种融合卷积神经网络和循环神经网络的问答方法及系统。
技术介绍
问答系统(QuestionAnswering,QA)是机器学习和人工智能领域长期研究的问题之一。最有名的故事就是IBMWatson在2011年参加Jeopardy竞赛,打败了所有人类竞争对手,获得了100万美元奖励。近些年,许多大型的通用知识图谱相继推出,比如YAGO、Freebase、NELL、DBpedie、zhishi.me等等。如何利用知识图谱结构化存储的知识进行问答成为了当下研究的热点。知识问答(也称知识库问答,知识图谱问答,简称KBQA)是指给定自然语言问题,通过对问题的语义解析和理解,进而利用知识图谱查询、推理得出答案。KBQA一般来说是以知识库里面的知识作为答案的来源。在一个知识库中存在大量三元组,例如(上海市,人口,2400万)表示上海市人口是2400万。每一个三元组是一个事实或者知识。现有的知识问答系统里面有两个难点:实体定位和属性推断。实体定位,即提取出问句中所提及实体(entitymention),现在比较主流的做法是对问句进行语义解析(sematicparser)和实体识别(entityrecognition)得到实体词,再与知识库中实体进行匹配查询。但是,这种做法会有许多无谓的字符串比较,导致查询效率较低等问题。属性推断,即把一个问句映射到相应的实体属性上去,解析问题在对哪一个属性进行发问。如在“上海市有多少人?”这例子中,属性推断要准确推断出是对“上海市”这个实体的“人口”属性。通常做法是利用规则模版匹配,然而,基于模版的相似匹配需要大量的人工整理,把实体每个属性的提问方式枚举出来,非常繁杂,且人工整理容易导致不完备等问题。综上所述,亟需提出一种新的知识问答系统,以解决现有知识问答系统中的实体定位和属性推断两大难题。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种融合卷积神经网络和循环神经网络的问答方法及系统,以克服现有技术中实体定位存在不可避免的字符串比较,导致查询效率较低以及属性推断需要大量的人工整理,把实体每个属性的提问方式枚举出来,非常繁杂,且人工整理容易导致不完备等问题。一方面,提供了一种融合卷积神经网络和循环神经网络的问答方法,所述方法包括如下步骤:S1:根据用户输入的问句,获取所述问句的实体以及所述实体的查询ID;S2:根据所述实体将所述问句简化成问句模式;S3:根据所述查询ID收集所述实体的相关属性,生成候选属性列表;S4:将所述问句模式以及所述候选属性列表输入预先训练好的属性判别器中,获取每个候选属性与问句的得分;S5:根据所述得分判定与所述问句最相近的属性关系,取出所述最相近的属性关系的属性值完成回答。进一步的,所述步骤S1具体包括:根据用户输入的问句,利用预先构建的字典树对所述问句进行实体定位,匹配出所述问句的实体以及所述实体对应的查询ID。进一步的,所述步骤S3具体包括:根据所述查询ID,在预先构建的知识图谱中查询并取出与所述实体连接的所有属性关系,生成候选属性列表。进一步的,所述步骤S4具体包括:S4.1:利用循环神经网络对所述问句进行语义建模,并根据每个候选属性加入注意力机制获取语义特征向量;S4.2:利用卷积神经网络对所述问句进行字词相似性建模获取字词特征向量;S4.3:结合所述语义特征向量和字词特征向量,通过线性神经网络获取每个候选属性与问句的得分。进一步的,所述步骤S4.1具体包括:S4.1.1:对所述问句和候选属性进行分词,根据预先构建的词向量库获取所述问句对应的词向量以及所述候选属性对应的关系向量,并将所述词向量拼接成句向量;S4.1.2:将所述句向量输入到循环神经网络中,将输出拼接成包含前后语义关系的新的句子;S4.1.3:将所述新的句子乘以注意力权重向量,获取针对于所述候选属性的新的句子表示;S4.1.4:根据所述新的句子表示与所述关系向量,获取所述候选属性的语义特征向量。进一步的,所述步骤S4.2具体包括:S4.2.1:根据所述问句对应的词向量以及所述候选属性对应的关系向量做相似计算,获取两两相似得分组成的相似矩阵;S4.2.2:将所述相似矩阵输入卷积神经网络,通过计算,获取字词特征向量。另一方面,提供了一种融合卷积神经网络和循环神经网络的问答系统,所述系统包括:实体获取模块,用于根据用户输入的问句,获取所述问句的实体以及所述实体的查询ID;问句简化模块,用于根据所述实体将所述问句简化成问句模式;属性获取模块,用于根据所述实体的查询ID收集所述实体的相关属性,生成候选属性列表;属性推断模块,用于将所述问句模式以及所述候选属性列表输入预先训练好的属性判别器中,获取每个候选属性与问句的得分;答案反馈模块,用于根据所述得分判定与所述问句最相近的属性,并根据所述最相近的属性完成回答。进一步的,所述实体获取模块具体用于:根据用户输入的问句,利用预先构建的字典树对所述问句进行实体定位,匹配出所述问句的实体以及所述实体对应的查询ID。进一步的,所述属性获取模块具体用于:根据所述查询ID,在预先构建的知识图谱中查询并取出与所述实体连接的所有属性关系,生成候选属性列表。进一步的,所述属性推断模块包括:语义理解单元,用于利用循环神经网络对所述问句进行语义建模,并根据每个候选属性加入注意力机制获取语义特征向量;词法相似单元,用于利用卷积神经网络对所述问句进行字词相似性建模获取字词特征向量;得分输出单元,用于结合所述语义特征向量和字词特征向量,通过线性神经网络获取每个候选属性与问句的得分。进一步的,所述语义理解单元包括:向量化子单元,用于对所述问句和候选属性进行分词,根据预先构建的词向量库获取所述问句对应的词向量以及所述候选属性对应的关系向量,并将所述词向量拼接成句向量;拼接子单元,用于将所述句向量输入到循环神经网络中,将输出拼接成包含前后语义关系的新的句子;融合子单元,用于将所述新的句子乘以注意力权重向量,获取针对于所述候选属性的新的句子表示;点乘子单元,用于根据所述新的句子表示与所述关系向量,获取所述候选属性的语义特征向量。进一步的,所述词法相似单元包括:相似矩阵子单元,用于根据所述问句对应的词向量以及所述候选属性对应的关系向量做相似计算,获取两两相似得分组成的相似矩阵;计算子单元,用于将所述相似矩阵输入卷积神经网络,通过计算,获取字词特征向量。本专利技术实施例提供的技术方案带来的有益效果是:1、本专利技术实施例提供的融合卷积神经网络和循环神经网络的问答方法及系统,通过利用预先构建的字典树对问句进行快速的实体定位,匹配出问句的实体以及实体对应的查询ID,可以满足高并发的商业系统,且可以减少无谓的字符串比较,提高查询效率;2、本专利技术实施例提供的融合卷积神经网络和循环神经网络的问答方法及系统,通过基于神经网络的方法进行属性推断,利用向量化的数值计算不需要人工整理模板,能够有效解决人工整理的操作繁杂以及不完备等问题。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员本文档来自技高网
...

【技术保护点】
1.一种融合卷积神经网络和循环神经网络的问答方法,其特征在于,所述方法包括如下步骤:S1:根据用户输入的问句,获取所述问句的实体以及所述实体的查询ID;S2:根据所述实体将所述问句简化成问句模式;S3:根据所述查询ID收集所述实体的相关属性,生成候选属性列表;S4:将所述问句模式以及所述候选属性列表输入预先训练好的属性判别器中,获取每个候选属性与问句的得分;S5:根据所述得分判定与所述问句最相近的属性关系,取出所述最相近的属性关系的属性值完成回答。

【技术特征摘要】
1.一种融合卷积神经网络和循环神经网络的问答方法,其特征在于,所述方法包括如下步骤:S1:根据用户输入的问句,获取所述问句的实体以及所述实体的查询ID;S2:根据所述实体将所述问句简化成问句模式;S3:根据所述查询ID收集所述实体的相关属性,生成候选属性列表;S4:将所述问句模式以及所述候选属性列表输入预先训练好的属性判别器中,获取每个候选属性与问句的得分;S5:根据所述得分判定与所述问句最相近的属性关系,取出所述最相近的属性关系的属性值完成回答。2.根据权利要求1所述的融合卷积神经网络和循环神经网络的问答方法,其特征在于,所述步骤S1具体包括:根据用户输入的问句,利用预先构建的字典树对所述问句进行实体定位,匹配出所述问句的实体以及所述实体对应的查询ID。3.根据权利要求1或2所述的融合卷积神经网络和循环神经网络的问答方法,其特征在于,所述步骤S3具体包括:根据所述查询ID,在预先构建的知识图谱中查询并取出与所述实体连接的所有属性关系,生成候选属性列表。4.根据权利要求1或2所述的融合卷积神经网络和循环神经网络的问答方法,其特征在于,所述步骤S4具体包括:S4.1:利用循环神经网络对所述问句进行语义建模,并根据每个候选属性加入注意力机制获取语义特征向量;S4.2:利用卷积神经网络对所述问句进行字词相似性建模获取字词特征向量;S4.3:结合所述语义特征向量和字词特征向量,通过线性神经网络获取每个候选属性与问句的得分。5.根据权利要求4所述的融合卷积神经网络和循环神经网络的问答方法,其特征在于,所述步骤S4.1具体包括:S4.1.1:对所述问句和候选属性进行分词,根据预先构建的词向量库获取所述问句对应的词向量以及所述候选属性对应的关系向量,并将所述词向量拼接成句向量;S4.1.2:将所述句向量输入到循环神经网络中,将输出拼接成包含前后语义关系的新的句子;S4.1.3:将所述新的句子乘以注意力权重向量,获取针对于所述候选属性的新的句子表示;S4.1.4:根据所述新的句子表示与所述关系向量,获取所述候选属性的语义特征向量。6.根据权利要求5所述的融合卷积神经网络和循环神经网络的问答方法,其特征在于,所述步骤S4.2具体包括:S4.2.1:根据所述问句对应的词向量以及所述候选属性对应的关系向量做相似计算,获取两两相似得分组成的相似矩阵;S4.2.2:将所述相似矩阵输入卷积神经网络,通过计算,获取字词特征向量。7.一种融合卷积神经网络和循环神经网络的问答系统,...

【专利技术属性】
技术研发人员:李勇张发幼周建华
申请(专利权)人:众安信息技术服务有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1