基于实体关系消歧的知识图谱问答方法、系统以及终端技术方案

技术编号:24457799 阅读:37 留言:0更新日期:2020-06-10 16:04
本发明专利技术涉及信息技术领域,涉及一种基于实体关系消歧的知识图谱问答方法、系统以及终端;所述方法包括获取用户终端输入的问句文本,识别出所述问句文本中的实体提及词、属性提及词和特定关系;将实体提及词和属性提及词链接到预先构建的知识图谱中,并根据所链接到的每个实体的二度关系子图建立出语义超图;利用从所述语义超图中包含出的每个实体的多粒度上下文特征,使用极端梯度提升算法进行二分类线性回归对实体和关系进行联合消歧;本发明专利技术通过一度关系子树和二度关系子树的评价得分,本发明专利技术避免的问句中隐式表达的信息被遗漏的问题。通过多粒度特征大大提升了实体和关系的消岐能力,大大提高了系统回答问题的准确率。

Question answering method, system and terminal of knowledge map based on entity relation disambiguation

【技术实现步骤摘要】
基于实体关系消歧的知识图谱问答方法、系统以及终端
本专利技术涉及信息
,特别是自然语言处理子领域,具体涉及一种基于语义超图联合消岐与评价的知识库问答方法、装置及终端。
技术介绍
随着互联网的飞速发展,各种知识日渐丰富甚至呈爆炸式增长;而知识图谱则能够很好的存储海量的知识,是人工智能领域中的一个重要方向,而如何利用好知识图谱来满足人们对于知识获取的需求也越来越需要被重视。所以能够通过自然语言问句去查询知识图谱获得问题的答案变得十分重要。知识库问答的目的是为人们提供有力的知识获取工具。而自然语言问句不能被计算机直接利用,所以需要先对问句进行问句理解,目前问句理解的方法包含语义解析、信息抽取以及向量建模等不同的方式。但目前多数的问答系统主要针对单一的、孤立的、事实性的问题,在答案的精准度以及问题的复杂度上受限于现有的计算模型复杂性和知识库完善程度,虽然许多研究机构和企业在开展智能问答研究,但其技术水平还有待进一步提高,且多数问答系统如果涉及到语义理解、复杂逻辑推理以及篇章层面语言分析等问题,一般也无法做出满意的回答。中国专利CN本文档来自技高网...

【技术保护点】
1.一种基于实体关系消歧的知识图谱问答方法,其特征在于,包括以下步骤:/nS1、获取用户终端输入的问句文本,识别出所述问句文本中的实体提及词、属性提及词和特定关系,并抽取出候选实体;/nS2、将实体提及词和属性提及词链接到预先构建的知识图谱中,并根据链接到知识图谱中的候选实体的二度关系子图建立出语义超图;/nS3、从所述语义超图中提取每个实体的多粒度上下文特征,使用极端梯度提升算法进行二分类线性回归对实体和关系进行联合消歧;/nS4、在联合消歧后的语义超图中,将每个实体顶点的一度关系子图中各个一度关系子树的实体及其实体关系按顺序拼接为第一字符串,计算出生成第一字符串的字符集合与问句字符集合的第...

【技术特征摘要】
1.一种基于实体关系消歧的知识图谱问答方法,其特征在于,包括以下步骤:
S1、获取用户终端输入的问句文本,识别出所述问句文本中的实体提及词、属性提及词和特定关系,并抽取出候选实体;
S2、将实体提及词和属性提及词链接到预先构建的知识图谱中,并根据链接到知识图谱中的候选实体的二度关系子图建立出语义超图;
S3、从所述语义超图中提取每个实体的多粒度上下文特征,使用极端梯度提升算法进行二分类线性回归对实体和关系进行联合消歧;
S4、在联合消歧后的语义超图中,将每个实体顶点的一度关系子图中各个一度关系子树的实体及其实体关系按顺序拼接为第一字符串,计算出生成第一字符串的字符集合与问句字符集合的第一字面相似度,以及第一字符串与问句的第一语义相似度;
S5、计算出各个一度关系子树中的实体关系集合与步骤S1抽取出的特定关系集合的第一交集数;根据所述第一交集数、所述第一语义相似度以及所述第一字面相似度计算出各个一度关系子树的评价得分;选择评价得分较高的作为第一候选答案子树;
S6、对第一候选答案子树进行拓展,将扩展后的二度关系子树中的实体及其实体关系按顺序拼接为第二字符串,计算生成第二字符串的字符集合与问句字符集合的第二字面相似度;若该第二字面相似度小于步骤S5所计算的第一字面相似度,则去掉该二度关系子树;否则继续计算第二字符串与问句的第二语义相似度;
S7、计算出各个二度关系子树中的实体关系集合与步骤S1抽取出的特定关系集合的第二交集数;根据所述第二交集数、所述第二语义相似度以及所述第二字面相似度计算出各个二度关系子树的评价得分;并将各个二度关系子树作为第二候选答案子树;
S8、获得在第一候选答案子树与第二候选答案子树中评价得分最高的候选答案查询子树,用该评价得分最高的候选答案查询子树生成查询语句在对应的图数据库中查询答案。


2.根据权利要求1所述的一种基于实体关系消歧的知识图谱问答方法,其特征在于,所述步骤S1中包括利用基于神经网络的实体关系联合抽取模型,抽取问句中的实体提及词和特定关系;使用实体提及词典、属性提及词典抽取问句文本中的实体提及词和属性提及词,并进行扩充,形成候选实体和属性值提及词集合。


3.根据权利要求1所述的一种基于实体关系消歧的知识图谱问答方法,其特征在于,所述步骤S3包括从所述语义超图中提取每个实体顶点的词语级特征,知识图谱上下文特征以及自然语言问句级特征;使用极端梯度提升算法进行二分类线性回归进行初步的联合消岐,保留语义超图中得分前五的实体顶点以及所述实体顶点的连接关系;其中词语级特征包括实体的长度特征fe-length,提及词与问句的词重叠数fm-overla...

【专利技术属性】
技术研发人员:周政邓蔚胡峰韩雨亭
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1