基于动态知识图谱的问答系统及方法技术方案

技术编号:25915040 阅读:60 留言:0更新日期:2020-10-13 10:33
本发明专利技术公开了基于动态知识图谱的问答系统及方法,通过关联实体关系构建子空间在子空间中融合新增实体,实现了知识图谱中实体更新不再依赖全局配置,能够在不同子空间中分别更新,从而消除了现有翻译模型需要超参数调整的需要,缓解了子空间中实体和关系的拥塞,同时也易于实现更新的并行化,增强了对动态数据尤其是新增实体的适应性,提高了问答系统的精度和时效性。

【技术实现步骤摘要】
基于动态知识图谱的问答系统及方法
本专利技术属于人工智能
,具体涉及基于动态知识图谱的问答系统及方法。
技术介绍
知识图谱是大规模的语义网络,由概念实体和语义关系构成,通过节点表示实体或者概念、边表示关系来描述真实世界中存在的各种实体或者概念以及其关系,通常以三元组表示,即:头实体、关系及尾实体。作为人工智能技术的重要组成部分,知识图谱因其强大的互联组织、信息检索以及知识推理能力,已经被广泛应用于智能搜索、人机问答、个性化推荐等方向,为医疗、金融等多个领域的知识化组织与智能化应用提供了技术基础。知识图谱分为静态知识图谱和动态知识图谱。所谓静态知识图谱就是封闭的知识图谱,知识图谱里不会有新的实体,已存在的实体也不会很大的更新。动态知识图谱是开放的知识图谱,这样的知识图谱会有新的实体加入,也会产生新的关系。问答系统是信息检索系统的高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求,问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。现有的问答系统主要包括以下两类:是基于模板匹配技术的知识图谱问答系统,采用自然语言处理、实体匹配和关系匹配等方法,将用户的问句转换为结构化的查询语句,再采用该结构化查询语句到知识图谱中检索,返回最终的结果;另是基于朴素贝叶斯分类的知识图谱问答系统,首先将用户所输入的自然语言进行分词处理,系统根据分词处理结果,使用朴素贝叶斯分类进行分类,从而推测出用户想要咨询的问题,最后系统会从数据库中提取出答案显示给用户。综上所述,现有的知识图谱问答系统存在的缺陷主要包括以下几点:1、知识图谱的构建是静态,现实社会中的知识是不断变更的,即知识是有时效性的,而现有的知识图谱数据大都是静态的;2、知识图谱对动态数据缺乏适应性,模型中缺少对增量更新的支持,特别是对于新增实体而言。
技术实现思路
有鉴于此,本专利技术提供了基于动态知识图谱的问答系统及方法,实现了知识图谱的动态更新,提高了问答系统的精度和时效性。本专利技术提供的基于动态知识图谱的问答方法,采用自然语言处理方法将用户问题转换为查询语句,使用所述查询语句在知识图谱中查找并返回对应的答案,所述知识图谱的更新过程包括以下步骤:步骤1、将更新文件转换为结构化的新增实体,所述新增实体包含实体属性及实体关系;步骤2、将所述新增实体进行聚类形成核心实体;选择与所述核心实体的实体关系的相似度大于设定阈值的实体关系作为关联实体关系;在原始知识图谱中选取包含所述关联实体关系的实体作为关联实体;步骤3、采用双向随机游走模型,以所述关联实体关系作为语义焦点、以所述关联实体为起点划分形成子空间;融合所述新增实体与所述子空间形成更新子空间;步骤4、对所述更新子空间进行知识图谱补全,形成更新知识图谱;将所述更新知识图谱与所述原始知识图谱合并形成新的知识图谱。进一步地,所述方法还包括根据历史答案进行预测的过程,具体包括以下步骤:根据所述历史答案的评分形成高分答案表;根据所述高分答案表中所包含的实体关系构建查询语句,使用所述查询语句在知识图谱中查找并返回答案。进一步地,所述步骤2中采用余弦相似度计算实体关系间的相似度。进一步地,包括用户交互模块、自然语言处理模块、知识图谱存储模块及知识图谱更新模块;其中,所述用户交互模块,用于将接收到的用户问题发送至所述自然语言处理模块;所述自然语言处理模块,用于将所述用户问题转换为查询语句,并将所述查询语句发送至所述知识图谱存储模块;将更新文件转换为结构化的新增实体,新增实体发送至所述知识图谱更新模块;所述知识图谱更新模块,用于将所述新增实体进行聚类形成核心实体,确定与所述核心实体的实体关系的相似度大于设定阈值的实体关系为关联实体关系;并在原始知识图谱中选取包含所述关联实体关系的实体作为关联实体;采用双向随机游走模型,以所述关联实体关系作为语义焦点、以所述关联实体为起点划分形成子空间;融合所述新增实体与所述子空间形成更新子空间;对所述更新子空间进行知识图谱补全,形成更新知识图谱;将所述更新知识图谱发送至所述知识图谱存储模块;所述知识图谱存储模块,用于存储知识图谱,并根据所述查询语句返回对应的答案;并将所述更新知识图谱与原始知识图谱合并形成新的知识图谱。进一步地,所述用户交互模块还用于对所述答案进行评分,并根据所述评分形成高分答案表。进一步地,所述系统还包括预测推荐模块,所述预测推荐模块用于根据所述高分答案表中所包含的实体关系构建复合查询语句,并将所述复合查询语句发送至所述知识图谱存储模块。有益效果:本专利技术通过关联实体关系构建子空间在子空间中融合新增实体,实现了知识图谱中实体更新不再依赖全局配置,能够在不同子空间中分别更新,从而消除了现有翻译模型需要超参数调整的需要,缓解了子空间中实体和关系的拥塞,同时也易于实现更新的并行化,增强了对动态数据尤其是新增实体的适应性,提高了问答系统的精度和时效性。附图说明图1为本专利技术提供的基于动态知识图谱的问答方法的知识图谱更新流程图。图2为本专利技术提供的基于动态知识图谱的问答方法的自然语言处理过程流程图。图3为本专利技术提供的基于动态知识图谱的问答方法的知识图谱更新流程图。图4为本专利技术提供的基于动态知识图谱的问答系统的结构示意图。图5为本专利技术提供的基于动态知识图谱的问答系统的知识图谱更新模块流程图。图6为本专利技术提供的基于动态知识图谱的问答系统的知识图谱存储结构示意图具体实施方式下面结合附图并举实施例,对本专利技术进行详细描述。本专利技术提供了基于动态知识图谱的问答方法,其核心思想是:采用自然语言处理方法将用户问题转换为查询语句,然后使用查询语句在知识图谱中查找并返回对应的答案,并且本专利技术中的知识图谱能够根据外部的更新文件进行动态更新。本专利技术提供的基于动态知识图谱的问答方法中知识图谱更新的过程,如图1所示,具体包括以下步骤:步骤1、将更新文件转换为结构化的新增实体,该新增实体包含实体属性及实体关系。本专利技术提出的方法可采用基于翻译模型(Trans系列模型)的知识表示方式实现。Trans系列模型是经典静态知识图谱补全模型之一,它将实体表示为三元组实例如:(head,relation,tail),其中,head和tail表示实体的属性,relation表示从实体head到实体tail的翻译,即实体间的关系。在此基础上,本专利技术中的实体表示为三元组(head,relation,tail),通过自然语言处理方法将更新文件转换为结构化的新增实体三元组。如图2所示,本专利技术中,采用自然语言处理方法完成对用户问题的转换形成查询语句,同时,采用自然语言处理方法完成对更新文件的处理,形成结构化的实体数据。步骤2、将新增实体进行聚类形成核心实体,选择与核心实体的实体关系的相似度大于设定阈值的实体关本文档来自技高网
...

【技术保护点】
1.基于动态知识图谱的问答方法,采用自然语言处理方法将用户问题转换为查询语句,使用所述查询语句在知识图谱中查找并返回对应的答案,其特征在于,所述知识图谱的更新过程包括以下步骤:/n步骤1、将更新文件转换为结构化的新增实体,所述新增实体包含实体属性及实体关系;/n步骤2、将所述新增实体进行聚类形成核心实体;选择与所述核心实体的实体关系的相似度大于设定阈值的实体关系作为关联实体关系;在原始知识图谱中选取包含所述关联实体关系的实体作为关联实体;/n步骤3、采用双向随机游走模型,以所述关联实体关系作为语义焦点、以所述关联实体为起点划分形成子空间;融合所述新增实体与所述子空间形成更新子空间;/n步骤4、对所述更新子空间进行知识图谱补全,形成更新知识图谱;将所述更新知识图谱与所述原始知识图谱合并形成新的知识图谱。/n

【技术特征摘要】
1.基于动态知识图谱的问答方法,采用自然语言处理方法将用户问题转换为查询语句,使用所述查询语句在知识图谱中查找并返回对应的答案,其特征在于,所述知识图谱的更新过程包括以下步骤:
步骤1、将更新文件转换为结构化的新增实体,所述新增实体包含实体属性及实体关系;
步骤2、将所述新增实体进行聚类形成核心实体;选择与所述核心实体的实体关系的相似度大于设定阈值的实体关系作为关联实体关系;在原始知识图谱中选取包含所述关联实体关系的实体作为关联实体;
步骤3、采用双向随机游走模型,以所述关联实体关系作为语义焦点、以所述关联实体为起点划分形成子空间;融合所述新增实体与所述子空间形成更新子空间;
步骤4、对所述更新子空间进行知识图谱补全,形成更新知识图谱;将所述更新知识图谱与所述原始知识图谱合并形成新的知识图谱。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括根据历史答案进行预测的过程,具体包括以下步骤:
根据所述历史答案的评分形成高分答案表;根据所述高分答案表中所包含的实体关系构建查询语句,使用所述查询语句在知识图谱中查找并返回答案。


3.根据权利要求1所述的方法,其特征在于,所述步骤2中采用余弦相似度计算实体关系间的相似度。


4.一种基于动态知识图谱的问答系统,其特征在于,包括用户交互模块、自然语言处理模块、知识...

【专利技术属性】
技术研发人员:陈婉月车海莺
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1