基于知识图谱的问答系统中的处理方法和装置制造方法及图纸

技术编号:24888838 阅读:43 留言:0更新日期:2020-07-14 18:16
本申请实施例公开了一种基于知识图谱的问答系统中的处理方法和装置。所述方法包括:在接收到问句后,获取所述问句在预先设置的知识库中对应的主实体;从所述主实体中选择至少两个候选主实体;以每个候选主实体为根节点,在预先存储的知识图谱中搜索所述根节点的相邻边以及相邻节点,并通过相邻节点搜索所述相邻节点在下一层的相邻边和相邻节点,以此类推,直到搜索到最后一层的节点,得到每个候选主实体对应的路径;计算每个候选主实体的路径所对应的文本信息与所述问句的文本信息的相似度;选择所述相似度符合预先设置的最高相似度判断条件的路径作为候选主实体的候选路径;从所述候选主实体的候选路径中得到所述主实体的最终选择路径;确定所述最终选择路径对应的文本信息,作为所述问句的答案。

【技术实现步骤摘要】
基于知识图谱的问答系统中的处理方法和装置
本申请实施例涉及信息处理领域,尤指一种基于知识图谱的问答系统中的处理方法和装置。
技术介绍
问答系统是一种信息检索系统的高级形式。基于知识图谱的问答(Knowledge-basedQuestionAnswering,KBQA,下称“知识问答”)是通过自然语言对话的形式帮助人们从知识库中获取知识。知识问答依托一个大型知识库(如知识图谱或结构化数据库等),将用户的自然语言问句转换成结构化查询语句(如SPARQL、SQL等),直接从知识库中导出用户所需的答案。知识库以RDF(ResourceDescriptionFramework,资源描述框架)的格式存储知识,每条知识被表示成一个三元组,即主体(Subject)、客体(Object)和述语(Predicate)。其中主体(Subject)、客体(Object)大多数时候为主实体,客体有时也会是属性值;述语(Predicate)是描述主体和客体之间的关系。所有的这样的三元组构成一个语义网络,即知识图谱。从图的角度来看,知识图谱由节点和边构成,对于任何一个三元组本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的问答系统中的处理方法,其特征在于,包括:/n在接收到问句后,获取所述问句在预先设置的知识库中对应的主实体;/n从所述主实体中选择至少两个候选主实体;/n以每个候选主实体为根节点,在预先存储的知识图谱中搜索所述根节点的相邻边以及相邻节点,并通过相邻节点搜索所述相邻节点在下一层的相邻边和相邻节点,以此类推,直到搜索到最后一层的节点,得到每个候选主实体对应的路径;/n计算每个候选主实体的路径所对应的文本信息与所述问句的文本信息的相似度;/n选择所述相似度符合预先设置的最高相似度判断条件的路径作为候选主实体的候选路径;/n从所述候选主实体的候选路径中得到所述主实体的最终选择路径;...

【技术特征摘要】
1.一种基于知识图谱的问答系统中的处理方法,其特征在于,包括:
在接收到问句后,获取所述问句在预先设置的知识库中对应的主实体;
从所述主实体中选择至少两个候选主实体;
以每个候选主实体为根节点,在预先存储的知识图谱中搜索所述根节点的相邻边以及相邻节点,并通过相邻节点搜索所述相邻节点在下一层的相邻边和相邻节点,以此类推,直到搜索到最后一层的节点,得到每个候选主实体对应的路径;
计算每个候选主实体的路径所对应的文本信息与所述问句的文本信息的相似度;
选择所述相似度符合预先设置的最高相似度判断条件的路径作为候选主实体的候选路径;
从所述候选主实体的候选路径中得到所述主实体的最终选择路径;
确定所述最终选择路径对应的文本信息,作为所述问句的答案。


2.根据权利要求1所述的方法,其特征在于,所述获取所述问句在预先设置的知识库中对应的主实体,包括:
利用预先获取的主实体词典识别所述问句中的主实体提及,得到第一识别结果,其中所述主实体词典包括所述知识库中所有的主体和客体;以及,利用预先获取的主题词识别的深度学习模型,识别所述问句中的主实体提及,得到第二识别结果;
将所述第一识别结果和所述第二识别结果合并为最终的识别结果;
在预先设置的链接词典中存储的主实体提及与知识库中主实体的对应关系,查找所述识别结果中的每个主实体提及对应的知识库中的主实体。


3.根据权利要求1所述的方法,其特征在于,所述从所述主实体中选择至少两个候选主实体,包括:
确定每个主实体的至少两个特征信息;
通过对同一个主实体的特征信息进行识别,得到每个主实体的得分信息;
根据每个主实体的得分信息,选择至少两个候选主实体。


4.根据权利要求1所述的方法,其特征在于,所述从所述候选主实体的候选路径中得到所述主实体的最终选择路径,包括:
判断所述候选路径的相似度之间的差值是否大于或等于预设的阈值;
如果所述差值大于或等于所述阈值,则选择所述候选路径中相似度最高的路径为最终选择路径;
如果所述差值小于所述阈值,则获取所述候选路径对应的文本信息与所述问句的重叠字数,选择重叠字数最多的路径为最终选择路径。


5.根据权利要求1所述的方法,其特征在于:
在所述问句中包括n个主实体时,选择所述n个主实体中一个主实体作为目标主实体,在确定目标主实体的候选主实体后,确定所述目标主实体的目标候选主实体;
其中所述目标候选主实体的候选路径是通过如下方式得到的,包括:
在以每个目标候选主实体为根节点进行相邻边和相邻节点的搜索过程中,在对所述相邻节点在下一层的相邻边和相邻节点的搜索时,利用所述n个主实体中的剩余的(n-1)个主实体进行路径的筛选,得到所述目标候选主实体的候选路径,其中n为大于等于2的整数。


6.一种基于知识图谱的问答系统中的处理装置,其特征...

【专利技术属性】
技术研发人员:张文剑牟小峰
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1