【技术实现步骤摘要】
一种基于图神经网络的多跳问答系统及方法
[0001]本专利技术涉及多跳问答的
,特别是涉及一种基于图神经网络的多跳问答系统及方法。
技术介绍
[0002]随着信息时代的不断发展,为了能更加高效地获取有效信息,能够针对用户输入问题,给出简洁、准确答案的问答系统成为了许多科研工作者的研究重点,其中,能够回答复杂问题的多跳问答系统是一个研究热点。
[0003]多跳问答系统中,针对给定的复杂问题,推理得到该问题答案所需的推理步数被称为问题的“跳数”,而现有的多跳问答系统在处理部分跳数很高的问题时,其准确率很低。
技术实现思路
[0004]本专利技术的目的在于解决现有多跳问答系统在处理跳数高的多跳问题时准确率低的问题,提供一种基于图神经网络的多跳问答系统及方法。
[0005]为实现上述目的,本专利技术采用以下技术方案:
[0006]一种基于图神经网络的多跳问答系统,包括问题筛选模块、图神经网络编码
‑
解码模块和节点融合替代模块,其中:所述问题筛选模块用于从多跳问答数据集中提取训练数据;所述图神经网络编码
‑
解码模块用于将所述训练数据拆分为多跳问题、多跳答案和支持文档后,分别进行预处理得到段落、句子、实体;并以所述段落、句子、实体为节点构建实体图;还用于将实体图与所述多跳答案和支持文档交互,获得多跳问题的答案;所述节点融合替代模块用于计算所述节点融合替代的条件概率,更新所述实体图并得到新多跳问题,还用于判断所述新多跳问题的实体数量。
[00 ...
【技术保护点】
【技术特征摘要】
1.一种基于图神经网络的多跳问答系统,其特征在于,包括问题筛选模块、图神经网络编码
‑
解码模块和节点融合替代模块,其中:所述问题筛选模块用于从多跳问答数据集中提取训练数据;所述图神经网络编码
‑
解码模块用于将所述训练数据拆分为多跳问题、多跳答案和支持文档后,分别进行预处理得到段落、句子、实体;并以所述段落、句子、实体为节点构建实体图;还用于将实体图与所述多跳答案和支持文档交互,获得多跳问题的答案;所述节点融合替代模块用于计算所述节点融合替代的条件概率,更新所述实体图并得到新多跳问题,还用于判断所述新多跳问题的实体数量。2.根据权利要求1所述的基于图神经网络的多跳问答系统,其特征在于,所述提取训练数据具体包括:判断多跳问答数据集中的多跳问题是否标注了问题跳数,若标注了问题跳数,则判断所述多跳问题的问题跳数,若所述问题跳数大于或等于3,则提取为训练数据,否则舍弃;若未标注问题跳数,则通过命名实体识别判断所述多跳问题中的实体数量,若所述实体数量小于4,则舍弃,若所述实体数量大于或等于4,则通过句子成分分析判断所述多跳问题中的实体关系的数量,若所述实体关系的数量大于或等于3,则提取为训练数据,否则舍弃。3.根据权利要求1所述的基于图神经网络的多跳问答系统,其特征在于,所述预处理包括句子成分分析、段落拆分、命名实体识别。4.根据权利要求3所述的基于图神经网络的多跳问答系统,其特征在于,所述图神经网络编码
‑
解码模块还用于对所述多跳问题进行预处理,所述预处理还包括标注所述多跳问题中的实体、实体关系和多跳问题语义。5.根据权利要求1所述的基于图神经网络的多跳问答系统,其特征在于,图神经网络编码
‑
解码模块包括图神经网络编码器和图神经网络解码器,所述图神经网络编码器用于以所述段落、句子、实体为节点构建实体图;所述图神经网络解码器用于将实体图与所述多跳答案和支持文档交互,获得多跳问题的答案。6.根据权利要求5所述的基于图神经网络的多跳问答系统,其特征在于,所述图神经网络编码
‑
解码模块还用于将所述段落、句子、实体编码为多维空间向量。7.根据权利要求6所述的基于图神经网络的多跳问答系统,其特征在于,所述图神经网络编码
‑
解码模块还用于将所述支持文档中评分最高的段落作为段落节点,将所述段落中的句子作为句子节点。8.根据权利要求1所述的基于图神经网络的多跳问答系统,其特征在于,所述更新所述实体图并得到新多跳问题具体包括:计算节点融合替代的条件概率后,选取条件概率值最大的对应实体进行实体替换得到新多跳问题,使得新多跳问题中包含的实体数量减少一个。9.根据权利要求8所述的基于图神经网络的多跳问答系统,其特征在于,所...
【专利技术属性】
技术研发人员:郑海涛,付轩,胡牛,李俊欣,
申请(专利权)人:清华大学深圳国际研究生院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。