当前位置: 首页 > 专利查询>天津大学专利>正文

一种对话式知识库问答实现方法技术

技术编号:33352562 阅读:50 留言:0更新日期:2022-05-08 10:01
本发明专利技术公开了一种对话式知识库问答实现方法,步骤1:预先定义模糊推理语法体系;步骤2:获取待回答的当前问题、对话历史信息,通过GloVe模型得到向量表示;步骤3:得到编码器的隐状态向量;步骤4:从特征表示中识别出命名实体及其类型;步骤5:得到知识库中的实体ID;步骤6:得到问题在当前语法框架下的逻辑形式;步骤7:预测问题中的关系ID和实体类型ID;步骤8:得到可在知识库上执行的查询语句;步骤9:在知识库中执行该查询语句,得到当前问题对应的答案。与现有技术相比,本发明专利技术自动识别出对话中用户问题的意图,提高了对话中应答的准确率,适用于开放领域知识图谱问答,能提升用户体验满意度。满意度。满意度。

【技术实现步骤摘要】
一种对话式知识库问答实现方法


[0001]本专利技术属于自然语言处理
,特别是涉及一种对话式知识库问答实现方法。

技术介绍

[0002]近年来,随着DBPedia、Wikidata、YAGO等知识库的发展,其规模变得越来越庞大。这使得没有专业背景的普通人从其中获取所需要的知识越来越困难。知识库问答(Knowledge Base Question Answering,KBQA)提供了一种有效便捷的方式,它旨在使用知识库中的知识回答用户以自然语言形式提出的问题。尽管目前已有大量的研究,但KBQA仍然是具有挑战的任务,尤其是在多轮对话的KBQA中,现有的方法也很难像人类一样精确理解对话中的问题。
[0003]随着深度学习技术的发展,利用神经网络进行KBQA的主流方法包括基于语义分析和基于信息检索的方法。基于语义分析的方法首先设计一个语义解析器将问题映射到逻辑形式,例如λ

DCS、SPARQL或SQL等,然后利用一个执行模块来执行知识库中的查询。基于信息检索的方法则首先标识主题实体,然后从知识图谱中检索距离主题实体一跳本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种对话式知识库问答实现方法,其特征在于,该方法包括以下步骤:步骤1:预先定义模糊推理语法体系;步骤2:获取待回答的当前问题、对话历史信息,通过GloVe模型得到向量表示;步骤3:通过基于多头注意力机制的编码器,得到编码器的隐状态向量,表示如下:h
enc
=encoder(x;θ
enc
)其中,encoder( )是编码器函数,θ
dec
是编码器函数的可训练参数;步骤4:通过基于LSTM的命名实体识别模型,从特征表示中识别出命名实体及其类型;步骤5:通过基于XLNet的实体消歧模型,将识别出的实体链接到知识库中的实体,得到知识库中的实体ID;步骤6:根据编码器的隐状态向量,通过基于多头注意力机制的解码器,得到问题在当前语法框架下的逻辑形式;表示如下:z
dec
=decoder(h
enc
;θ
dec
)其中,decoder( )是解码器函数,θ
dec
是编码器函数的可训练参数,z
dec
是解码器函数的隐状态向量,P(y
dec
|x)表示y
dec
相对于y
dec
的概率,y
dec
是输入序列,y
dec
是解码任务的真实标签,W
dec
是一个线性层,用以转换解码器隐状态向量的维度;步骤7:根据编码器的隐状态向量最后一位、解码器的隐状态向量和知识库知识,预测问题中的关系ID和实体类型ID;步骤8:将实体ID、关系ID、实体类型ID与解码得到的逻辑形式整合,得到可在知识库上执行的查询语句;步骤9:在知识库中执行该查询语句,得到当前问题对应的答案。2.如权利要求1所述的一种对话式知识库问答实现方法,其特征在于,所述步骤1包括定义查询类操作、筛选类操作、计数类操作、严格比较类操作、模糊比较类操作和集合类操作。3.如权利要求1所述的一种对话式知识库问答实现方法,其特征在于,所述步骤2以下具体操作:步骤S201:获取当前问题及对话历史信息,对问题进行预处理,预处理包括:去除问句中的标点符号(如问句末尾的问号、句号等),以及对问句中的单词进行小写转化等;步骤S202:将当前问题及对话历史信息进行拼接,构成新的问题;步骤S203:获取输入的向量表示,使用GloVe模型来获得每个单词的向量表示。4.如权利要求1所述的一种对话式知识库问答实现方法,其特征在于,所述步骤4具体包括以下操作:步骤S401:通过基于LSTM的命名实体识别模型,从特征表示中识别出命名实体及其类型,表示如下:h
LSTM
=LSTM(h
enc
;θ
LSTM
)其中,LSTM( )是长短期记忆网络,θ
LSTM
是LSTM的可训练参数,h
LSTM
是通过LSTM得到的隐状态向量;步骤S402:筛选识别出的实体,通过前馈神经网络,对问题中的实体进行筛选,表示如
下:h
FFN
=LeakyReLU(W
FFN1
[h
enc
;h
LSTM
])其中,LeakyReLU( )是带泄露修正线性单元,W
FFN1
和W
FFN2
是线性层1和2的可训练参数,用以变换矩阵维度,h
FFN
是前馈神经网络的隐状态向量,P(y
ER
|x)表示y
ER
相对于x的概率,x是输入序列,y
ER

【专利技术属性】
技术研发人员:熊德意李俊卓
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1