基于语义空间共享的知识图谱问答系统技术方案

技术编号:26259368 阅读:48 留言:0更新日期:2020-11-06 17:53
基于语义空间共享的知识图谱问答系统,它属于中文知识图谱问答技术领域。本发明专利技术解决了现有知识图谱问答系统中各模块之间信息共享不足,导致获得的答案实体的准确率有限的问题。本发明专利技术利用问句主实体识别子模块,实体链接子模块和关系预测子模块的训练数据来联合训练BERT预训练语言模型,通过将联合训练好的模型嵌入各子模块,以实现语义空间的信息共享。通过本发明专利技术方法可以确保问句主实体识别子模块能够且只能从自然语言问句中识别出一个主实体,通过各子模块之间的语义信息共享,可以有效提高获得的答案实体的准确率。通过实验证明,采用本发明专利技术方法获得的答案实体的准确率可以达到86.64%。本发明专利技术可以应用于知识图谱问答。

【技术实现步骤摘要】
基于语义空间共享的知识图谱问答系统
本专利技术属于中文知识图谱问答
,具体涉及一种基于语义空间共享的知识图谱问答系统。
技术介绍
知识图谱问答技术是一种特殊的自动问答技术,其目标是以知识图谱作为知识来源,在给定一个自然语言问句时自动给出正确的答案。该技术提供了一种自然直接的方法访问海量知识图谱信息。目前有多种不同的知识图谱问答模型,这些模型主要可以分为两大类。第一类模型基于语义分析。这类模型通过对自然语言问句进行细致的语义分析将问句转换为SPARQL等结构化逻辑表示,在知识图谱上执行相应的查询来直接获得答案。传统的语义分析方法依赖人工标注的逻辑表达式作为监督信息,因此该方法被局限在标注数据所能覆盖的少数几种关系谓词上。模式匹配可以用来扩大语义分析模型的应用范围,利用外部资源进行弱监督学习来实现同样的目的。第二类模型基于信息检索技术。该类模型首先从知识图谱中获取所有可能的候选三元组(头实体,关系,尾实体),然后通过机器学习或深度学习方法对候选三元组进行排序。排名最高的三元组即为预测结果。此类方法一般不需要人工设计规则或特征,本文档来自技高网...

【技术保护点】
1.基于语义空间共享的知识图谱问答系统,其特征在于,所述系统包括问句主实体识别子模块,实体链接子模块和关系预测子模块,其中:/n所述问句主实体识别子模块,实体链接子模块和关系预测子模块内部均嵌入有BERT预训练语言模型;所述BERT预训练语言模型是通过三个子模块的联合训练获得的;/n问句主实体识别子模块用于对输入的自然语言问句进行编码,分别获得自然语言问句中每个字符的向量表示,并根据每个字符的向量表示确定主实体的开始位置和结束位置,得到输入的自然语言问句中的主实体;/n实体链接子模块用于预测输入的自然语言问句中主实体在知识图谱中的实体名;/n关系预测子模块用于预测输入的自然语言问句中关系谓词在...

【技术特征摘要】
1.基于语义空间共享的知识图谱问答系统,其特征在于,所述系统包括问句主实体识别子模块,实体链接子模块和关系预测子模块,其中:
所述问句主实体识别子模块,实体链接子模块和关系预测子模块内部均嵌入有BERT预训练语言模型;所述BERT预训练语言模型是通过三个子模块的联合训练获得的;
问句主实体识别子模块用于对输入的自然语言问句进行编码,分别获得自然语言问句中每个字符的向量表示,并根据每个字符的向量表示确定主实体的开始位置和结束位置,得到输入的自然语言问句中的主实体;
实体链接子模块用于预测输入的自然语言问句中主实体在知识图谱中的实体名;
关系预测子模块用于预测输入的自然语言问句中关系谓词在知识图谱中的关系名;
在知识图谱中,预测出的实体名通过预测出的关系谓词连接到的尾实体为答案实体。


2.根据权利要求1所述的基于语义空间共享的知识图谱问答系统,其特征在于,所述BERT预训练语言模型是通过三个子模块的联合训练获得的,问句主实体识别子模块的训练数据是自然语言问句和自然语言问句中的主实体;实体链接子模块的训练数据是自然语言问句、正确和错误主实体在知识图谱中的实体名,将正确主实体在知识图谱中的实体名作为正样本,错误主实体在知识图谱中的实体名作为负样本;关系预测子模块的训练数据是自然语言问句、正确和错误关系谓词在知识图谱中的关系名,将正确关系谓词在知识图谱中的关系名作为正样本,将错误关系谓词在知识图谱中的关系名作为负样本。


3.根据权利要求2所述的基于语义空间共享的知识图谱问答系统,其特征在于,所述问句主实体识别子模块,实体链接子模块和关系预测子模块中的BERT预训练语言模型共享BERT网络参数,不共享输出层参数。


4.根据权利要求1所述的基于语义空间共享的知识图谱问答系统,...

【专利技术属性】
技术研发人员:朱聪慧徐冰杨沐昀曹海龙赵铁军
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1