当前位置: 首页 > 专利查询>浙江大学专利>正文

一种面向知识图谱问答的复合问句解析方法技术

技术编号:24996079 阅读:90 留言:0更新日期:2020-07-24 17:58
本发明专利技术公开了一种面向知识图谱问答的复合问句解析方法,包括:接收复合问题并获得中心词,作为查询的起点;在解耦器中,将复合问题分解为多个简单问题;在关系检测器中,计算各个简单问题与候选关系的匹配概率,选择概率最大的关系作为该简单问题所属的关系,以中心词为起点、各个简单问题所属的关系为边,在知识图谱中进行匹配,得到复合问题的预测答案;计算复合问题的预测答案与真实答案的损失值,使用优化算法迭代求解直至损失值收敛,得到复合问题的答案。本发明专利技术所述的复合问句解析方法结合强化学习的思想,将复合问题分解为简单问题,再通过各个简单问题的答案组合出原始复合问题的答案,提升了智能问答系统在回答复合问题时的表现。

【技术实现步骤摘要】
一种面向知识图谱问答的复合问句解析方法
本专利技术涉及知识问答系统领域,具体涉及一种面向知识图谱问答的复合问句解析方法。
技术介绍
问答系统(QuestionAnsweringSystem,QA)是信息检索系统的一种高级形式,其研究兴起的主要原因是人们对快速、准确地获取信息的需求,问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。面向知识图谱的智能问答系统(KBQA)在知识图谱中的大量事实和回答自然语言表示的问题之间搭建了一座桥梁,通过问答系统这个接口,用户可以轻松地使用自然语言在知识图谱中查询问题的答案。传统的回答复合问题的语义解析过程包括两部分,首先检测问题中提及的作为主题词的实体,该实体作为在知识图谱中查询的起点,然后寻找由多个关系组成的路径,该路径从主题词(起点)连接至复合问题的答案(终点)。对于知识图谱搜索空间的组合泛化,许多方法将KBQA定义为一个两阶段的串行任务,包括实体链接和关系检测;一些研究聚焦于直接对自然语言问题进行语义分析,把问题解析为结构化的查询,这往往需要大量预本文档来自技高网...

【技术保护点】
1.一种面向知识图谱问答的复合问句解析方法,其特征在于,包括:/n(1)接收客户提出的复合问题,获得复合问题的中心词,作为查询的起点;/n(2)在解耦器中,将复合问题分解为多个简单问题;/n(3)在关系检测器中,计算步骤(2)得到的简单问题与各个候选关系的匹配概率,选择概率最大的关系作为该简单问题所属的关系,以中心词为起点、各个简单问题所属的关系为边,在知识图谱中进行匹配,得到复合问题的答案。/n

【技术特征摘要】
1.一种面向知识图谱问答的复合问句解析方法,其特征在于,包括:
(1)接收客户提出的复合问题,获得复合问题的中心词,作为查询的起点;
(2)在解耦器中,将复合问题分解为多个简单问题;
(3)在关系检测器中,计算步骤(2)得到的简单问题与各个候选关系的匹配概率,选择概率最大的关系作为该简单问题所属的关系,以中心词为起点、各个简单问题所属的关系为边,在知识图谱中进行匹配,得到复合问题的答案。


2.根据权利要求1所述的面向知识图谱问答的复合问句解析方法,其特征在于,步骤(2)中,所述的复合问题由N个单词组成的单词序列,具体为式(1)所示;
X={X1,X2,……,Xi,XN}(1)
其中,X为复合问题;Xi为单词。


3.根据权利要求1所述的面向知识图谱问答的复合问句解析方法,其特征在于,步骤(2)中,所述的解耦器包括输入模块、记忆模块和动作模块。


4.根据权利要求3所述的面向知识图谱问答的复合问句解析方法,其特征在于,所述的输入模块中每个单词都对应一个嵌入向量和一个动作;每个动作对应一个独热嵌入向量;
所述的独热嵌入向量为式(2)所示:
a={a1,a2,……ai,aN}(2)
其中,a为独热嵌入向量;ai为每个单词的独热嵌入向量;
所述的嵌入向量为式(3)所示:
e={e1,e2,……ei,eN}(3)
其中,e为嵌入向量;ei为每个单词的嵌入向量。


5.根据权利要求4所述的面向知识图谱问答的复合问句解析方法,其特征在于,所述的输入模块的迭代过程中,将单词的嵌入向量与该单词对应的上一次的动作的独热嵌入向量连接起来,得到记忆模块的输入向量;
所述的记忆模块的输入向量为式(4)所示:
xi=[ei,ai-1](4)
其中,xi为每个单词对应的记忆模块的输入向量;ei为每个单词的嵌入向量;ai-1为每个单词对应的上一次的动作的独热嵌入向量。


6.根据权利要求3所述的面向知识图谱问答的复合问句解析方法,其特征在于,所述的记忆模块中利用长短期记忆神经网络LSTM存储输入模块的输出向量,在每次迭代时更新记忆模块所处状态,并输出记忆模块当前层所处的状态与当前所处的隐藏状态的两个状态的连接作为解耦器当前所处的状态向量;
所述的更新记忆模块所处状态的计算公式具体为式(5)所示:
ii=σ(wi[xi,hi-1]+bi)
fi=σ(wf[xi,...

【专利技术属性】
技术研发人员:陈华钧杨帆杨海宏
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1