基于领域知识图谱的知识问答方法及其装置制造方法及图纸

技术编号:39491517 阅读:7 留言:0更新日期:2023-11-24 11:13
本发明专利技术公开了一种基于领域知识图谱的知识问答方法及其装置

【技术实现步骤摘要】
基于领域知识图谱的知识问答方法及其装置、电子设备


[0001]本专利技术涉及人工智能领域,具体而言,涉及一种基于领域知识图谱的知识问答方法及其装置

电子设备


技术介绍

[0002]当前,在金融服务场景中
(
例如,金融市场交易场景
)
,需要手动进行交易事前调研

数据分析以及交易决策,往往面临无法快速从海量信息中获取有效信息,并及时对信息进行整合

分析,导致出现决策困难

决策不准确等问题,进而影响业务效率和增长

[0003]随着生成式模型的发布
(
例如,
ChatGPT
,全称
Chat Generative Pre

trained Transformer
,即一种聊天机器人程序
)
,自然语言文本理解和生成能力得到了显著提升,智能知识问答推理服务水平有了很大改善

然而,当前的生成式模型仍存在逻辑推理不靠谱

生成结果事实性低的问题,更无法为领域类
(
例如,金融领域
)
问题提供专业

准确的答案

[0004]相关技术中,往往采用如下方案进行智能知识问答:
(1)
基于知识图谱的智能问答推理
(2)
问答对匹配
(3)
基于生成式模型进行智能问答,其中,
[0005](1)
基于知识图谱的智能问答推理,能够基于知识图谱技术,构建通用或专业领域的知识图谱,实现知识推理智能问答应用

[0006]图1是根据相关技术的一种可选的基于知识图谱的智能问答推理的示意图,如图1所示,包括:问题分析模块

问题回答模块

答案生成模块,其中,问题分析模块包括:问题分类以及
NLP(Natural Language Processing
,即自然语言处理
)
技术,可以先对输入的问题进行问题分类,然后利用
NLP
技术进行问题关键词提取

语义分析等处理;问题回答模块包括:模式匹配以及知识问答,通过对问题分析模块传输的数据进行语义理解和解析,利用知识库进行查询

推理得出答案;答案生成模块:能够根据问题分析模块传输的数据,对候选答案进行打分,选出最佳答案

[0007](2)
问答对匹配,依赖问答库,通过计算语义的相似性来匹配答案

[0008](3)
基于生成式模型进行智能问答,基于预先训练好的模型按照上下文场景

用户问题等信息进行意图识别和语义分析,并生成问答答案

[0009]图2是根据相关技术的一种可选的基于生成式模型进行智能问答的示意图,如图2所示,模型包括:意图分析

语义分析以及答案生成等模块,将问题输入至模型中,对问题进行意图分析以及语义分析,然后通过答案生成模块得到问答答案

[0010]然而,相关技术中的智能知识问答方案存在如下问题:
(1)
对于基于模型进行智能问答推理方案,存在推理结果不可靠

结果可控性低等问题

一方面模型主要通过自收集

自标注的数据进行预训练,若训练样本数据存在样本不均衡,可能导致模型出现偏见性

公平性问题;另一方面针对领域类场景,模型进行预训练的数据中没有足够的专业样本数据
(
或者某些领域样本数据很少
)
,且模型从网络中收集的信息,也面临非事实性问题,导致模型推理生成的内容可靠性低,且无法真正为领域类问题提供专业

靠谱的答案,而如果采用新标注领域类专业样本数据并注入模型进行预训练,则面临人力

计算成本高,且不能保证
模型在领域类各细分场景都达到预期效果的问题;
(2)
对于基于知识图谱的智能问答推理方案,存在架构调整难,不易根据新的数据或场景进行修改和调整的问题,并且还存在推理能力弱,图谱构建成本高等问题

[0011]针对上述的问题,目前尚未提出有效的解决方案


技术实现思路

[0012]本专利技术实施例提供了一种基于领域知识图谱的知识问答方法及其装置

电子设备,以至少解决相关技术中对问题进行知识问答推理的准确性较低的技术问题

[0013]根据本专利技术实施例的一个方面,提供了一种基于领域知识图谱的知识问答方法,包括:接收目标问题,并对所述目标问题进行处理,得到问题提示信息;基于所述目标问题,抽取目标实体集合或者目标关系集合,其中,所述目标实体集合包括:多个目标实体,所述目标关系集合包括:多个目标关系;在抽取到所述目标实体集合的情况下,基于所述目标实体集合,从预设领域知识图谱中检索与所述目标实体匹配的三元组信息,或者在抽取到所述目标关系集合的情况下,基于所述目标关系集合,从预设领域知识图谱中检索与所述目标关系匹配的三元组信息,得到三元组信息集合;基于所述三元组信息集合以及所述问题提示信息,构建输入知识信息,并将所述输入知识信息输入至预设推理模型,输出所述目标问题的目标答案

[0014]可选地,对所述目标问题进行处理,得到问题提示信息的步骤,包括:构建问题提示模板,其中,所述问题提示模板包括:问题指令;基于所述问题提示模板,在所述目标问题中加入所述问题指令,生成所述问题提示信息

[0015]可选地,基于所述目标问题,抽取目标实体集合或者目标关系集合的步骤,包括:对所述目标问题进行分词处理,得到多个分词;对所述分词进行分析,确定所述分词的词类型;在所述词类型是第一预设类型的情况下,将所述词类型指示的所述分词确定为所述目标实体,或者,在所述词类型是第二预设类型的情况下,将所述词类型指示的所述分词确定为所述目标关系,得到所述目标关系集合;在所有所述词类型都不是所述第一预设类型以及所述第二预设类型的情况下,确定所述目标问题的上下文信息,并基于所述上下文信息,补充所述目标问题对应的所述目标实体;基于所有所述目标实体,生成所述目标实体集合

[0016]可选地,所述三元组信息包括:主体实体

对象实体和实体关系,在抽取到所述目标实体集合的情况下,基于所述目标实体集合,从预设领域知识图谱中检索与所述目标实体匹配的三元组信息,得到三元组信息集合的步骤,包括:确定检索跳数阈值以及初始检索跳数;从所述预设领域知识图谱中检索与所述目标实体匹配的知识图谱实体,其中,所述知识图谱实体是所述主体实体或者对象实体;在检索到与所述目标实体匹配的第一知识图谱实体的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于领域知识图谱的知识问答方法,其特征在于,包括:接收目标问题,并对所述目标问题进行处理,得到问题提示信息;基于所述目标问题,抽取目标实体集合或者目标关系集合,其中,所述目标实体集合包括:多个目标实体,所述目标关系集合包括:多个目标关系;在抽取到所述目标实体集合的情况下,基于所述目标实体集合,从预设领域知识图谱中检索与所述目标实体匹配的三元组信息,或者在抽取到所述目标关系集合的情况下,基于所述目标关系集合,从预设领域知识图谱中检索与所述目标关系匹配的三元组信息,得到三元组信息集合;基于所述三元组信息集合以及所述问题提示信息,构建输入知识信息,并将所述输入知识信息输入至预设推理模型,输出所述目标问题的目标答案
。2.
根据权利要求1所述的知识问答方法,其特征在于,对所述目标问题进行处理,得到问题提示信息的步骤,包括:构建问题提示模板,其中,所述问题提示模板包括:问题指令;基于所述问题提示模板,在所述目标问题中加入所述问题指令,生成所述问题提示信息
。3.
根据权利要求1所述的知识问答方法,其特征在于,基于所述目标问题,抽取目标实体集合或者目标关系集合的步骤,包括:对所述目标问题进行分词处理,得到多个分词;对所述分词进行分析,确定所述分词的词类型;在所述词类型是第一预设类型的情况下,将所述词类型指示的所述分词确定为所述目标实体,或者,在所述词类型是第二预设类型的情况下,将所述词类型指示的所述分词确定为所述目标关系,得到所述目标关系集合;在所有所述词类型都不是所述第一预设类型以及所述第二预设类型的情况下,确定所述目标问题的上下文信息,并基于所述上下文信息,补充所述目标问题对应的所述目标实体;基于所有所述目标实体,生成所述目标实体集合
。4.
根据权利要求1所述的知识问答方法,其特征在于,所述三元组信息包括:主体实体

对象实体和实体关系,在抽取到所述目标实体集合的情况下,基于所述目标实体集合,从预设领域知识图谱中检索与所述目标实体匹配的三元组信息,得到三元组信息集合的步骤,包括:确定检索跳数阈值以及初始检索跳数;从所述预设领域知识图谱中检索与所述目标实体匹配的知识图谱实体,其中,所述知识图谱实体是所述主体实体或者对象实体;在检索到与所述目标实体匹配的第一知识图谱实体的情况下,对所述初始检索跳数进行更新操作,得到当前检索跳数;在所述当前检索跳数小于所述检索跳数阈值的情况下,基于所述实体关系,确定与所述第一知识图谱实体关联的第二知识图谱实体;更新所述当前检索跳数,并继续基于所述实体关系,确定与所述第二知识图谱实体关联的第三知识图谱实体,直到所述当前检索跳数大于等于所述检索跳数阈值,得到知识图
谱实体集合;基于所述知识图谱实体集合,确定每个所述知识图谱实体所属的所述三元组信息,得到所述三元组信息集合
。5.
根据权利要求1所述的知识问答方法,其特征在于,在抽取到所述目标关系集合的情况下,基于所述目标关系集合,从预设领域知识图谱中检索与所述目标关系匹配的三元组信息,得到三元组信息集合的步骤,包括:从所述预设领域知识图谱中检索与所述目标关系匹...

【专利技术属性】
技术研发人员:吴建花翁晓俊李瑾瑜刘安平
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1