一种基于图神经网络的多跳问答系统及方法技术方案

技术编号:38338062 阅读:10 留言:0更新日期:2023-08-02 09:18
本发明专利技术公开了一种基于图神经网络的多跳问答系统及方法,该系统包括:问题筛选模块用于从多跳问答数据集中提取训练数据;图神经网络编码

【技术实现步骤摘要】
一种基于图神经网络的多跳问答系统及方法


[0001]本专利技术涉及多跳问答的
,特别是涉及一种基于图神经网络的多跳问答系统及方法。

技术介绍

[0002]随着信息时代的不断发展,为了能更加高效地获取有效信息,能够针对用户输入问题,给出简洁、准确答案的问答系统成为了许多科研工作者的研究重点,其中,能够回答复杂问题的多跳问答系统是一个研究热点。
[0003]多跳问答系统中,针对给定的复杂问题,推理得到该问题答案所需的推理步数被称为问题的“跳数”,而现有的多跳问答系统在处理部分跳数很高的问题时,其准确率很低。

技术实现思路

[0004]本专利技术的目的在于解决现有多跳问答系统在处理跳数高的多跳问题时准确率低的问题,提供一种基于图神经网络的多跳问答系统及方法。
[0005]为实现上述目的,本专利技术采用以下技术方案:
[0006]一种基于图神经网络的多跳问答系统,包括问题筛选模块、图神经网络编码

解码模块和节点融合替代模块,其中:所述问题筛选模块用于从多跳问答数据集中提取训练数据;所述图神经网络编码

解码模块用于将所述训练数据拆分为多跳问题、多跳答案和支持文档后,分别进行预处理得到段落、句子、实体;并以所述段落、句子、实体为节点构建实体图;还用于将实体图与所述多跳答案和支持文档交互,获得多跳问题的答案;所述节点融合替代模块用于计算所述节点融合替代的条件概率,更新所述实体图并得到新多跳问题,还用于判断所述新多跳问题的实体数量。
[0007]在本专利技术的一些实施例中,所述提取训练数据具体包括:判断多跳问答数据集中的多跳问题是否标注了问题跳数,若标注了问题跳数,则判断所述多跳问题的问题跳数,若所述问题跳数大于或等于3,则提取为训练数据,否则舍弃;若未标注问题跳数,则通过命名实体识别判断所述多跳问题中的实体数量,若所述实体数量小于4,则舍弃,若所述实体数量大于或等于4,则通过句子成分分析判断所述多跳问题中的实体关系的数量,若所述实体关系的数量大于或等于3,则提取为训练数据,否则舍弃。
[0008]在本专利技术的一些实施例中,所述预处理包括句子成分分析、段落拆分、命名实体识别。
[0009]在本专利技术的一些实施例中,所述图神经网络编码

解码模块还用于对所述多跳问题进行预处理,所述预处理还包括标注所述多跳问题中的实体、实体关系和多跳问题语义。
[0010]在本专利技术的一些实施例中,图神经网络编码

解码模块包括图神经网络编码器和图神经网络解码器,所述图神经网络编码器用于以所述段落、句子、实体为节点构建实体图;所述图神经网络解码器用于将实体图与所述多跳答案和支持文档交互,获得多跳问题的答案。
[0011]在本专利技术的一些实施例中,所述图神经网络编码

解码模块还用于将所述段落、句子、实体编码为多维空间向量。
[0012]在本专利技术的一些实施例中,所述图神经网络编码

解码模块还用于将所述支持文档中评分最高的段落作为段落节点,将所述段落中的句子作为句子节点。
[0013]在本专利技术的一些实施例中,所述更新所述实体图并得到新多跳问题具体包括:计算节点融合替代的条件概率后,选取条件概率值最大的对应实体进行实体替换得到新多跳问题,使得新多跳问题中包含的实体数量减少一个。
[0014]在本专利技术的一些实施例中,所述节点融合替代的条件概率的计算公式为:
[0015][0016]其中e表示自然对数,Q

表示新多跳问题,Q

表示为[q1,q2,

,q
m
‑1,q
*
,q
m+2


,q
i
],q
m
,q
m+1
表示所述实体图中具有相互关系的节点,p
j
表示所述实体图中的段落节点,s
k
表示段落节点p
j
中的句子节点,表示段落节点p
j
中的句子节点sk的各个对应实体(l=1,2,...,k);q
*
是的特例,表示段落节点p
j
中的句子节点s
k
的替换实体;s(q
*
|q
m
,q
m+1
,p
j
,s
k
)表示在给定q
m
,q
m+1
,p
j
,s
k
条件下,q*替代节点q
m
,q
m+1
的概率,表示在给定q
m
,q
m+1
,p
j
,s
k
条件下,替代节点q
m
,q
m+1
的概率。
[0017]本专利技术还提供一种基于图神经网络的多跳问答方法,基于如上所述的基于图神经网络的多跳问答系统,包括如下步骤:S1:通过所述问题筛选模块从多跳问答数据集中提取训练数据;S2:通过所述图神经网络编码

解码模块将所述训练数据拆分为多跳问题、多跳答案和支持文档,并分别进行预处理得到段落、句子、实体;S3:通过所述图神经网络编码

解码模块以所述段落、句子、实体为节点构建实体图;S4:通过所述节点融合替代模块计算所述节点融合替代的条件概率,更新所述实体图并得到新多跳问题;S5:通过所述节点融合替代模块判断所述新多跳问题的实体数量,若所述新多跳问题的实体数量大于指定值,则重复步骤S4;S6:通过所述图神经网络编码

解码模块将更新后的实体图与所述多跳答案和支持文档交互,获得所述新多跳问题的答案。
[0018]本专利技术具有如下有益效果:
[0019]本专利技术提出的基于图神经网络的多跳问答系统,通过问题筛选模块从多跳问答数据集中提取训练数据,通过图神经网络编码

解码模块将训练数据拆分为多跳问题、多跳答案和支持文档,分别进行预处理得到段落、句子、实体;并以所述段落、句子、实体为节点构建实体图,将实体图与所述多跳答案和支持文档交互,获得多跳问题的答案;通过节点融合替代模块,降低跳数高的复杂多跳问题中的实体数量,能够减少多跳问答系统寻找多跳答案所需的文档数量和推理步数,将跳数较多的多跳问题转化为跳数较少的新多跳问题,从而提高多跳问答系统整体准确度。
[0020]此外,在本专利技术的一些实施例中,还具有如下有益效果:
[0021]通过选择跳数较高的多跳问题作为训练数据,能够提高训练数据的质量,能够让多跳问答系统更多地学习到复杂问题的特征,从而提高多跳问答系统的性能。
[0022]在实体图中,每个节点经过图神经网络编码后在实体图空间中都有对应的位置,不会因为节点融合替代导致语义信息丢失。
[0023]本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的多跳问答系统,其特征在于,包括问题筛选模块、图神经网络编码

解码模块和节点融合替代模块,其中:所述问题筛选模块用于从多跳问答数据集中提取训练数据;所述图神经网络编码

解码模块用于将所述训练数据拆分为多跳问题、多跳答案和支持文档后,分别进行预处理得到段落、句子、实体;并以所述段落、句子、实体为节点构建实体图;还用于将实体图与所述多跳答案和支持文档交互,获得多跳问题的答案;所述节点融合替代模块用于计算所述节点融合替代的条件概率,更新所述实体图并得到新多跳问题,还用于判断所述新多跳问题的实体数量。2.根据权利要求1所述的基于图神经网络的多跳问答系统,其特征在于,所述提取训练数据具体包括:判断多跳问答数据集中的多跳问题是否标注了问题跳数,若标注了问题跳数,则判断所述多跳问题的问题跳数,若所述问题跳数大于或等于3,则提取为训练数据,否则舍弃;若未标注问题跳数,则通过命名实体识别判断所述多跳问题中的实体数量,若所述实体数量小于4,则舍弃,若所述实体数量大于或等于4,则通过句子成分分析判断所述多跳问题中的实体关系的数量,若所述实体关系的数量大于或等于3,则提取为训练数据,否则舍弃。3.根据权利要求1所述的基于图神经网络的多跳问答系统,其特征在于,所述预处理包括句子成分分析、段落拆分、命名实体识别。4.根据权利要求3所述的基于图神经网络的多跳问答系统,其特征在于,所述图神经网络编码

解码模块还用于对所述多跳问题进行预处理,所述预处理还包括标注所述多跳问题中的实体、实体关系和多跳问题语义。5.根据权利要求1所述的基于图神经网络的多跳问答系统,其特征在于,图神经网络编码

解码模块包括图神经网络编码器和图神经网络解码器,所述图神经网络编码器用于以所述段落、句子、实体为节点构建实体图;所述图神经网络解码器用于将实体图与所述多跳答案和支持文档交互,获得多跳问题的答案。6.根据权利要求5所述的基于图神经网络的多跳问答系统,其特征在于,所述图神经网络编码

解码模块还用于将所述段落、句子、实体编码为多维空间向量。7.根据权利要求6所述的基于图神经网络的多跳问答系统,其特征在于,所述图神经网络编码

解码模块还用于将所述支持文档中评分最高的段落作为段落节点,将所述段落中的句子作为句子节点。8.根据权利要求1所述的基于图神经网络的多跳问答系统,其特征在于,所述更新所述实体图并得到新多跳问题具体包括:计算节点融合替代的条件概率后,选取条件概率值最大的对应实体进行实体替换得到新多跳问题,使得新多跳问题中包含的实体数量减少一个。9.根据权利要求8所述的基于图神经网络的多跳问答系统,其特征在于,所...

【专利技术属性】
技术研发人员:郑海涛付轩胡牛李俊欣
申请(专利权)人:清华大学深圳国际研究生院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1