一种基于多策略的知识图谱问答方法技术

技术编号:35814087 阅读:9 留言:0更新日期:2022-12-03 13:37
本发明专利技术公开了一种基于多策略的知识图谱问答方法,该方法包括根据问题内容对问题的类型进行分类,采用实体识别模型识别问题实体,通过模糊查询对问题实体与图谱节点进行链接,并根据问题将所需查找内容转换为Cypher语句,针对不同类型问题选择不同查询策略,获得问题对应的三元组,利用模糊查询为问题实体匹配相似图谱节点,利用BERT模型为问题关系匹配相关节点与边,利用语义相似模型选取与问题最相似的节点或边,并作为问题答案输出。本发明专利技术针对静态类问题提供属性查询类检索方法;针对动态类问题提供时间推理类或统计查询类检索方法,并为不同类型问题提出不同的问答策略,从而实现动态类问题的答案检索。现动态类问题的答案检索。现动态类问题的答案检索。

【技术实现步骤摘要】
一种基于多策略的知识图谱问答方法


[0001]本专利技术涉及信息处理与分析
,尤其涉及到一种基于多策略的知识图谱问答方法。

技术介绍

[0002]智能问答式自然语言处理领域的研究热点之一,近年来备受关注。随着知识图谱的不断发展,各领域通过构建专有领域知识图谱并作为智能问答的高质量数据来源,相较于传统数据库,知识图谱更直观的展现了数据关系与数据特征。
[0003]目前知识图谱问答针对的问题主要包括目标的属性查询类、简单关系推理类等,图谱问答通过对问题进行语义理解与解析,从知识图谱中抽取答案。具体实现流程:首先将问题实体链接至知识图谱节点中,基于该图谱节点检索出所有与问题相关的三元组作为候选答案集,再计算问题与候选答案见语义相似度,选择相似度最大的作为问题答案。但目前的知识图谱问答还存在两个问题:
[0004]一是目前的知识图谱问答方法针对所有问题均采用统一的查询模式,答案查询模式固定且单一,不能对特定类型问题进行特定查询,会出现部分问题无法匹配正确答案的情况;
[0005]二是知识图谱问答涉及的问题类型较单一,知识图谱问答主要是针对静态属性类内容进行提问,静态属性类内容指目标或事物客观存在且不会随时间发生改变的客观事实属性;而针对目标、事件统计类、数值计算类等动态类问题,知识图谱问答无法返回相关问题答案。

技术实现思路

[0006]本专利技术的主要目的在于提供一种基于多策略的知识图谱问答方法,旨在解决目前知识图谱问答模式单一、仅能针对静态属性类问题进行查询、答案正确率低的技术问题。
[0007]为实现上述目的,本专利技术提供一种基于多策略的知识图谱问答方法,所述方法包括以下步骤:
[0008]S1:根据问题内容对问题的类型进行分类;
[0009]S2:基于已分类的问题,采用实体识别模型识别问题实体,通过模糊查询对问题实体与图谱节点进行链接,并根据问题将所需查找内容转换为 Cypher语句,针对不同类型问题选择不同查询策略,获得问题对应的三元组;
[0010]S3:利用模糊查询为问题实体匹配相似图谱节点,利用BERT模型为问题关系匹配相关节点与边,利用语义相似模型选取与问题最相似的节点或边,并作为问题答案输出。
[0011]可选的,所述问题的类型包括属性查询类问题、统计查询类问题和时间推理类问题。
[0012]可选的,对于属性查询类问题,所述步骤S2具体包括:
[0013]S201:采用BERT+BiLSTM+CRF模型对问题进行命名实体识别;
[0014]S202:将问题实体链接至图谱节点,判断问题实体是否匹配到图谱节点,若是,利用Cypher语言模糊查询该节点的所有三元组,执行步骤S204,否则执行步骤S203;
[0015]S203:对实体进行再分词处理,返回步骤S202;
[0016]S204:将搜索出的所有三元组及问题文本进行向量化表示;
[0017]S205:采用BERT模型分别度量问题与每个三元组的相似性,返回相似值最大的三元组;
[0018]S206:将返回三元组的尾实体作为问题答案输出。
[0019]可选的,对于统计查询类问题,所述步骤S2具体包括:
[0020]S221:采用基于项目数据训练后的BERT+BiLSTM+CRF模型识别出问题主体;
[0021]S222:再利用实体识别模型识别出问题客体;
[0022]S223:利用Cypher语句将问题主体作为头实体,问题客体作为尾实体,进行三元组模糊查询;
[0023]S224:返回模糊查询匹配的所有尾实体作为问题答案;若模糊查询无结果,执行步骤S225,否则,执行步骤S226;
[0024]S225:利用Cypher语句将问题主体作为尾实体,问题客体作为头实体,进行三元组模糊查询;
[0025]S226:返回模糊查询匹配的所有头实体,作为问题答案;若模糊查询无结果,终止;
[0026]S227:统计返回问题答案的实体数量,作为另一个问题结果输出。
[0027]可选的,对于时间推理类问题,所述步骤S2具体包括:
[0028]S231:采用BERT+BiLSTM+CRF模型识别出问题实体;
[0029]S232:设置时间计算规则,输入问题,返回问句中涉及的起始时间与结束时间;
[0030]S233:计算起始时间与结束时间差值,从而统计起始时间与结束时间之间的每天日期,将其存为时间列表;
[0031]S234:在知识图谱中,以问题实体为节点,依次遍历时间列表,将列表中的每个日期作为关系边或图谱节点,利用Cypher语句进行三元组模糊查询;
[0032]S235:将模糊查询出的节点或关系边依次存入答案列表;
[0033]S236:输出问题答案。
[0034]可选的,所述步骤S3具体包括:
[0035]S311:采集专业领域的实体数据和语义相似文本数据,利用该数据训练 BERT+BILSTM实体识别模型和BERT语义相似模型;
[0036]S312:利用训练好的BERT+BiLSTM模型识别问题实体,并将实体链接至知识图谱中,若成功,跳转步骤4;若实体未链接至图谱节点,则跳转步骤3;
[0037]S313:依次遍历图谱节点,利用BERT模型将节点与问题实体进行语义相似匹配,返回相似值最高的图谱节点;
[0038]S314:将搜索出的图谱节点作为中心点,查询该节点的所有相关三元组,并将三元组保存于列表中;
[0039]S315:再依次遍历三元组列表,利用BERT语义相似模型度量三元组与问题文本间的相似值,返回相似值最高的三元组,三元组包含的关系边即是问题关系;
[0040]S316:返回图谱节点和关系边;
[0041]S317:利用语义相似模型选取与问题最相似的节点或边,并作为问题答案输出。
[0042]本专利技术实施例提出的一种基于多策略的知识图谱问答方法,该方法包括根据问题内容对问题的类型进行分类,采用实体识别模型识别问题实体,通过模糊查询对问题实体与图谱节点进行链接,并根据问题将所需查找内容转换为Cypher语句,针对不同类型问题选择不同查询策略,获得问题对应的三元组,利用模糊查询为问题实体匹配相似图谱节点,利用BERT模型为问题关系匹配相关节点与边,利用语义相似模型选取与问题最相似的节点或边,并作为问题答案输出。本专利技术针对静态类问题提供属性查询类检索方法;针对动态类问题提供时间推理类或统计查询类检索方法,并为不同类型问题提出不同的问答策略,从而实现动态类问题的答案检索。
附图说明
[0043]图1为本专利技术一种基于多策略的知识图谱问答方法的流程示意图;
[0044]图2为本专利技术一种基于多策略的知识图谱问答方法的原理示意图;
[0045]图3为本专利技术属性查询类问题的答案查询模式的示意图;
[0046]图4为本专利技术统计查询类问题的答案查询模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多策略的知识图谱问答方法,其特征在于,所述方法包括以下步骤:S1:根据问题内容对问题的类型进行分类;S2:基于已分类的问题,采用实体识别模型识别问题实体,通过模糊查询对问题实体与图谱节点进行链接,并根据问题将所需查找内容转换为Cypher语句,针对不同类型问题选择不同查询策略,获得问题对应的三元组;S3:利用模糊查询为问题实体匹配相似图谱节点,利用BERT模型为问题关系匹配相关节点与边,利用语义相似模型选取与问题最相似的节点或边,并作为问题答案输出。2.如权利要求1所述的基于多策略的知识图谱问答方法,其特征在于,所述问题的类型包括属性查询类问题、统计查询类问题和时间推理类问题。3.如权利要求2所述的基于多策略的知识图谱问答方法,其特征在于,对于属性查询类问题,所述步骤S2具体包括:S201:采用BERT+BiLSTM+CRF模型对问题进行命名实体识别;S202:将问题实体链接至图谱节点,判断问题实体是否匹配到图谱节点,若是,利用Cypher语言模糊查询该节点的所有三元组,执行步骤S204,否则执行步骤S203;S203:对实体进行再分词处理,返回步骤S202;S204:将搜索出的所有三元组及问题文本进行向量化表示;S205:采用BERT模型分别度量问题与每个三元组的相似性,返回相似值最大的三元组;S206:将返回三元组的尾实体作为问题答案输出。4.如权利要求2所述的基于多策略的知识图谱问答方法,其特征在于,对于统计查询类问题,所述步骤S2具体包括:S221:采用基于项目数据训练后的BERT+BiLSTM+CRF模型识别出问题主体;S222:再利用实体识别模型识别出问题客体;S223:利用Cypher语句将问题主体作为头实体,问题客体作为尾实体,进行三元组模糊查询;S224:返回模糊查询匹配的所有尾实体作为问题答案;若模糊查询无结果,执行步骤S225,否则,执行步骤S226;S2...

【专利技术属性】
技术研发人员:陈莹崔莹代翔何建军杨露雋兆波李春豹刘鑫丁洪丽
申请(专利权)人:中国电子科技集团公司第十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1