基于知识图谱的问答方法、电子装置、设备及存储介质制造方法及图纸

技术编号:22166853 阅读:19 留言:0更新日期:2019-09-21 10:33
本发明专利技术公开了一种基于知识图谱的问答方法、电子装置、设备及存储介质,能够在基于知识图谱的问答系统中,通过在常规的基于深度网络的关系分类模型的上层加入对抗生成训练,有效地提升模型精度,使得问答更加准确。以及由于实际应用中限于效率的要求,不可能进行多个模型的集成。这就要进行模型选择,但是有时模型的表现比较接近,这时可以通过对抗训练,来看模型两两对抗的结果,选取更加鲁棒的模型来使用,大大地降低了研发成本。

Question and Answer Method, Electronic Device, Equipment and Storage Media Based on Knowledge Map

【技术实现步骤摘要】
基于知识图谱的问答方法、电子装置、设备及存储介质
本专利技术涉及智能
,尤其涉及一种基于知识图谱的问答方法、电子装置、设备及存储介质。
技术介绍
随着计算机技术的普及,当今人们的生活已经逐渐走入智能时代。不仅仅是电脑,手机,PAD,人们的衣食住行的方方面面都开始应用出现不久的智能技术,智能电视,智能导航,智能家居等等,智能技术将在人们生活的各个方面提供方便快捷的服务。问答系统(QuestionAnsweringsystem,QAsystem)是用来回答人提出的自然语言问题的系统。基于知识图谱的问答系统(KGQA)越来越受到重视,目前尚处于研究与探索阶段。主要原因是算法研究还刚起步,模型表现仍然有待提高。阻碍算法精度提高的一个主要原因是:对于图谱中一个实体,其所连接的一跳关系往往以百计,如果算上多跳关系,数量将是几何级数爆炸式增多。这样巨大的搜索空间,对模型的训练提出了巨大挑战。问答数据集中,一个真实问句,只对应知识图谱中的一个关系(或关系串)。算法一般以此为正样本,然后以随机采样的方式选取实体对应的其他关系,来作为负样本。然而,当正负样本的比例失衡的情况下,基于知识图谱的问答系统的问答结果准确率大大地降低。
技术实现思路
有鉴于此,本专利技术提出一种基于知识图谱的问答方法、电子装置、设备及存储介质,能够在基于知识图谱的问答系统中,通过在常规的基于深度网络的关系分类模型的上层加入对抗生成训练,有效地提升模型精度,使得问答更加准确。首先,为实现上述目的,本专利技术提出一种基于知识图谱的问答方法,应用于电子装置中,该方法包括步骤:确定预训练后的第一模型为生成对抗网络的生成器;及确定预训练后的第二模型为生成对抗网络的判别器;通过第一模型对获取到的用户输入的问题数据进行知识图谱查询,找到所述问题数据连接的N个问答关系,并将N个所述问答关系与真实答案组成一组正负样本组;通过所述第一模型和所述第二模型根据二人零和博弈对对抗生成网络进行训练,确定最终模型关系;根据最终模型关系对问题数据通过查询图谱匹配到最终答案数据。进一步地,通过第一模型对获取到的用户输入的问题数据进行知识图谱查询,找到所述问题数据连接的N个问答关系,并将N个所述问答关系与真实答案组成一组正负样本组的步骤,包括:通过第一模型将获取的用户输入的问题数据进行实体连接找到对应的主题实体,对主题实体进行知识图谱查询,找到所述问题数据连接的N个问答关系;通过第一模型将N个所述问答关系与真实答案组成一组正负样本组。进一步地,通过第一模型将N个所述问答关系与真实答案组成一组正负样本组的步骤,包括:通过第一模型对N个所述问答关系进行与问题数据的相关性评分;根据相关性评分的结果选取分数排名为预置排名数前的M个问答关系,其中,N>M;通过第一模型将M个所述问答关系与真实答案组成一组正负样本组。进一步地,适于通过所述第一模型和所述第二模型根据二人零和博弈对对抗生成网络进行训练,确定最终模型关系的步骤,包括:对所述第一模型和所述第二模型的参数进行策略梯度算法的强化学习;根据策略梯度算法的强化学习后的结果确定所述第一模型或所述第二模型中一个为最终关系分类器,并确定最终模型关系。进一步地,根据策略梯度算法的强化学习后的结果确定所述第一模型或所述第二模型中一个为最终关系分类器,并确定最终模型关系的步骤,包括:确定策略梯度算法的强化学习之后的所述第一模型和所述第二模型达到纳什均衡;根据所述第一模型和所述第二模型的结果,确定最优的所述第一模型或所述第二模型为最终关系分类器,并确定最终模型关系。进一步地,确定预训练后的第一模型为生成对抗网络的生成器,及确定预训练后的第二模型为生成对抗网络的判别器的步骤,之前还包括:对基于神经网络的KGQA关系分类模型的所述第一模型和所述第二模型进行预置训练数据的预训练;其中,第一模型和第二模型的网络结构不同,预置训练数据按照预置正负样本比例随机生成。进一步地,通过第一模型对获取到的用户输入的问题数据进行知识图谱查询,找到所述问题数据连接的N个问答关系,并将N个所述问答关系与真实答案组成一组正负样本组的步骤,之前还包括:获取用户输入的自然查询语句对应的问题数据。从数据库提取若干个用户历史输入的自然查询语句对应的问题数据。此外,为实现上述目的,本专利技术还提供一种电子装置,其包括:第一确定模块,适于确定预训练后的第一模型为生成对抗网络的生成器;第二确定模块,适于确定预训练后的第二模型为生成对抗网络的判别器;查询模块,适于通过第一模型对获取到的用户输入的问题数据进行知识图谱查询,找到所述问题数据连接的N个问答关系,并将N个所述问答关系与真实答案组成一组正负样本组;对抗生成网络模块,适于通过所述第一模型和所述第二模型根据二人零和博弈对对抗生成网络进行训练,确定最终模型关系;匹配模块,适于根据最终模型关系对问题数据通过查询图谱匹配到最终答案数据。进一步地,查询模块,适于通过第一模型将获取的用户输入的问题数据进行实体连接找到对应的主题实体,对主题实体进行知识图谱查询,找到所述问题数据连接的N个问答关系;通过第一模型将N个所述问答关系与真实答案组成一组正负样本组。进一步地,对抗生成网络模块,适于对所述第一模型和所述第二模型进行ReinforcementLearning(强化学习);确定所述第一模型或所述第二模型中一个为最终关系分类器,并确定最终模型关系。进一步地,对抗生成网络模块,适于对所述第一模型和所述第二模型进行ReinforcementLearning(强化学习)ReinforcementLearning;确定ReinforcementLearning之后的所述第一模型和所述第二模型达到纳什均衡;根据所述第一模型和所述第二模型的结果,确定最优的所述第一模型或所述第二模型为最终关系分类器,并确定最终模型关系。进一步地,预训练模块,适于预训练两个不同的基于神经网络的KGQA关系分类模型为所述第一模型和所述第二模型;其中,第一模型和第二模型的网络结构不同,训练数据按照预置正负样本比例随机生成。进一步地,获取模块,适于获取用户输入的自然查询语句对应的问题数据。为实现上述目的,本专利技术还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。为实现上述目的,本专利技术还提供计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。相较于现有技术,本专利技术所提出的基于知识图谱的问答方法、电子装置、设备及存储介质,能够在基于知识图谱的问答系统中,通过在常规的基于深度网络的关系分类模型的上层加入对抗生成训练,有效地提升模型精度,使得问答更加准确。以及由于实际应用中限于效率的要求,不可能进行多个模型的集成。这就要进行模型选择,但是有时模型的表现比较接近,这时可以通过对抗训练,来看模型两两对抗的结果,选取更加鲁棒的模型来使用,大大地降低了研发成本。附图说明图1是本专利技术实施例之电子装置一可选的应用环境图;图2是本专利技术第一实施例之电子装置的硬件架构示意图;图3是本专利技术第一实施例之电子装置的程序模块示意图;图4是本专利技术第二实施例之电子装置的程序模块示意图;图5是本专利技术第一本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的问答方法,应用于电子装置中,其特征在于,所述方法包括步骤:确定预训练后的第一模型为生成对抗网络的生成器;及确定预训练后的第二模型为生成对抗网络的判别器;通过第一模型对获取到的用户输入的问题数据进行知识图谱查询,找到所述问题数据连接的N个问答关系,并将N个所述问答关系与真实答案组成一组正负样本组;通过所述第一模型和所述第二模型根据二人零和博弈对对抗生成网络进行训练,确定最终模型关系;根据最终模型关系对问题数据通过查询图谱匹配到最终答案数据。

【技术特征摘要】
1.一种基于知识图谱的问答方法,应用于电子装置中,其特征在于,所述方法包括步骤:确定预训练后的第一模型为生成对抗网络的生成器;及确定预训练后的第二模型为生成对抗网络的判别器;通过第一模型对获取到的用户输入的问题数据进行知识图谱查询,找到所述问题数据连接的N个问答关系,并将N个所述问答关系与真实答案组成一组正负样本组;通过所述第一模型和所述第二模型根据二人零和博弈对对抗生成网络进行训练,确定最终模型关系;根据最终模型关系对问题数据通过查询图谱匹配到最终答案数据。2.如权利要求1所述的基于知识图谱的问答方法,其特征在于,通过第一模型对获取到的用户输入的问题数据进行知识图谱查询,找到所述问题数据连接的N个问答关系,并将N个所述问答关系与真实答案组成一组正负样本组的步骤,包括:通过第一模型将获取的用户输入的问题数据进行实体连接找到对应的主题实体,对主题实体进行知识图谱查询,找到所述问题数据连接的N个问答关系;通过第一模型将N个所述问答关系与真实答案组成一组正负样本组。3.如权利要求2所述的基于知识图谱的问答方法,其特征在于,通过第一模型将N个所述问答关系与真实答案组成一组正负样本组的步骤,包括:通过第一模型对N个所述问答关系进行与问题数据的相关性评分;根据相关性评分的结果选取分数排名为预置排名数前的M个问答关系,其中,N>M;通过第一模型将M个所述问答关系与真实答案组成一组正负样本组。4.如权利要求1所述的基于知识图谱的问答方法,其特征在于,通过所述第一模型和所述第二模型根据二人零和博弈对对抗生成网络进行训练,确定最终模型关系的步骤,包括:对所述第一模型和所述第二模型的参数进行策略梯度算法的强化学习;根据策略梯度算法的强化学习后的结果确定所述第一模型或所述第二模型中一个为最终关系分类器,并确定最终模型关系。5.如权利要求4所述的基于知识图谱的问答方法,其特征在于,根据策略梯度算法的强化学习后的结果确定所述第一模型或所述第二模型中一个为最终关系分类器,并确定最终模型关系的步骤,包括...

【专利技术属性】
技术研发人员:朱威倪渊谢国彤
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1