基于知识图谱的问答方法及装置制造方法及图纸

技术编号:38030935 阅读:10 留言:0更新日期:2023-06-30 10:57
本发明专利技术提供一种基于知识图谱的问答方法及装置,涉及人工智能技术领域,可应用于金融技术领域或其他技术领域。该基于知识图谱的问答方法包括:从用户问句中提取实体提及,根据实体提及确定知识图谱的主题实体;根据主题实体和实体提及确定实体提及相似度;根据主题实体、知识图谱和用户问句确定候选相似度;根据实体提及相似度和候选相似度向用户推送答案。本发明专利技术可以同时保证处理速度和问答精度。本发明专利技术可以同时保证处理速度和问答精度。本发明专利技术可以同时保证处理速度和问答精度。

【技术实现步骤摘要】
基于知识图谱的问答方法及装置


[0001]本专利技术涉及人工智能
,具体地,涉及一种基于知识图谱的问答方法及装置。

技术介绍

[0002]知识图谱是一种以多关系有向图的形式存储人类知识的数据结构。知识图谱中的每一个节点表示一个实体,两个节点之间的有向边表示实体之间的关系,一个<实体

关系

实体>代表一个三元组。知识图谱问答是基于知识图谱,对给定的问题进行分析推理,得到图谱中的答案,例如问题“李白是哪个朝代的诗人?”,通过图谱中的三元组<李白

朝代

唐朝>,可以得到<唐朝>这个答案。
[0003]基于信息检索(Information Retrieval,IR)的方法是目前知识图谱问答的主流方式之一,根据特征表示不同,信息检索方法可以分为基于特征工程的方法和基于表示学习的方法。基于表示学习的方法旨在将自然语言问题和知识图谱中的实体和关系映射为同一低维空间中的特征变量,将任务转化为问题向量与知识图谱中对应关系向量之间的相似度匹配任务。具体过程为首先识别出用户问句中的实体提及词,然后链接到图谱中的主题实体上,从主题实体的相关子图中获取候选关系路径作为候选答案集合,然后分别从用户问句和候选路径中抽取特征,最后利用排序模型对问句和候选路径进行建模并预测。
[0004]因此编码器的性能会直接影响到知识图谱问答的性能,知识图谱的规模通常在万级甚至千万级不等,在大规模知识图谱问答领域,基于表示学习的方法在计算速度和问答精度是两个关键点,存在较大的挑战。
[0005]现有的基于信息检索的知识图谱问答方法通过对比知识图谱候选路径和用户问句间的相似度来进行答案选择,当知识图谱规模较大时,单独使用基于交叉编码器或双编码器结构的模型,难以兼顾速度和精度。
[0006]1、交互式匹配
[0007]交互式匹配可以在两个句子间实现更细粒度的匹配,通常可以取得较好的效果,但是交叉编码的方式不能产生句子嵌入,无法预先离线计算句子的表征向量,每计算一个用户问句就要遍历所有(用户问句,候选答案句子)的组合,来依次计算其相似度,所以相当耗时,当图谱数据量较大时,处理时间也会成指数级别上升,实际应用时难以落地。
[0008]2、孪生网络
[0009]基于双编码器的孪生网络(伪孪生网络、三元组网络),可以产生句子嵌入,预先离线计算出句子向量进行高效比较,在实际应用中更快,但是准确性较低,在下游任务中表现较差。三元组网络虽然在性能上略有提升,但是比较依赖数据集的质量,如果负例数据质量较低,模型效果的提升也有限。

技术实现思路

[0010]本专利技术实施例的主要目的在于提供一种基于知识图谱的问答方法及装置,以解决
现有技术中处理速度和问答精度无法兼顾的问题。
[0011]为了实现上述目的,本专利技术实施例提供一种基于知识图谱的问答方法,包括:
[0012]从用户问句中提取实体提及,根据实体提及确定知识图谱的主题实体;
[0013]根据主题实体和实体提及确定实体提及相似度;
[0014]根据主题实体、知识图谱和用户问句确定候选相似度;
[0015]根据实体提及相似度和候选相似度向用户推送答案。
[0016]在其中一种实施例中,根据主题实体、知识图谱和用户问句确定候选相似度包括:
[0017]根据主题实体和知识图谱确定候选答案句子和候选关系名称;
[0018]根据用户问句、候选答案句子和候选关系名称确定候选相似度。
[0019]在其中一种实施例中,候选相似度包括候选句子相似度和候选关系相似度;
[0020]根据用户问句、候选答案句子和候选关系名称确定候选相似度包括:
[0021]根据用户问句和候选答案句子确定候选句子相似度;
[0022]根据用户问句和候选关系名称确定候选关系相似度。
[0023]在其中一种实施例中,根据实体提及相似度和候选相似度向用户推送答案包括:
[0024]根据实体提及相似度和候选相似度得到候选问题相似度;
[0025]根据候选问题相似度向用户推送答案。
[0026]在其中一种实施例中,根据候选问题相似度向用户推送答案包括:
[0027]根据候选问题相似度确定目标相似度;
[0028]确定目标相似度对应的候选答案句子为目标答案句子,确定目标相似度对应的候选关系名称为目标关系名称;
[0029]向用户推送根据目标答案句子和目标关系名称从知识图谱中获取的答案。
[0030]在其中一种实施例中,根据实体提及相似度和候选相似度确定候选问题相似度包括:
[0031]拼接实体提及相似度和候选相似度得到拼接相似度;
[0032]将拼接相似度输入预设的相似度模型中得到候选问题相似度。
[0033]本专利技术实施例还提供一种基于知识图谱的问答装置,包括:
[0034]主题实体模块,用于从用户问句中提取实体提及,根据实体提及确定知识图谱的主题实体;
[0035]实体提及相似度模块,用于根据主题实体和所述实体提及确定实体提及相似度;
[0036]候选相似度模块,用于根据主题实体、知识图谱和用户问句确定候选相似度;
[0037]推送模块,用于根据实体提及相似度和候选相似度向用户推送答案。
[0038]在其中一种实施例中,候选相似度模块包括:
[0039]候选答案句子和候选关系名称单元,用于根据主题实体和所述知识图谱确定候选答案句子和候选关系名称;
[0040]候选相似度单元,用于根据用户问句、候选答案句子和候选关系名称确定候选相似度。
[0041]在其中一种实施例中,候选相似度包括候选句子相似度和候选关系相似度;
[0042]候选相似度单元包括:
[0043]候选句子相似度子单元,用于根据用户问句和候选答案句子确定候选句子相似
度;
[0044]候选关系相似度子单元,用于根据用户问句和候选关系名称确定候选关系相似度。
[0045]在其中一种实施例中,推送模块包括:
[0046]候选问题相似度单元,用于根据实体提及相似度和候选相似度得到候选问题相似度;
[0047]推送单元,用于根据候选问题相似度向用户推送答案。
[0048]在其中一种实施例中,推送单元包括:
[0049]目标相似度子单元,用于根据候选问题相似度确定目标相似度;
[0050]目标答案句子和目标关系名称子单元,用于确定目标相似度对应的候选答案句子为目标答案句子,确定目标相似度对应的候选关系名称为目标关系名称;
[0051]推送子单元,用于向用户推送根据目标答案句子和目标关系名称从知识图谱中获取的答案。
[0052]在其中一种实施例中,候选问题相似度单元包括:
[005本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的问答方法,其特征在于,包括:从用户问句中提取实体提及,根据所述实体提及确定知识图谱的主题实体;根据所述主题实体和所述实体提及确定实体提及相似度;根据所述主题实体、所述知识图谱和所述用户问句确定候选相似度;根据所述实体提及相似度和所述候选相似度向用户推送答案。2.根据权利要求1所述的基于知识图谱的问答方法,其特征在于,根据所述主题实体、所述知识图谱和所述用户问句确定候选相似度包括:根据所述主题实体和所述知识图谱确定候选答案句子和候选关系名称;根据所述用户问句、所述候选答案句子和所述候选关系名称确定所述候选相似度。3.根据权利要求2所述的基于知识图谱的问答方法,其特征在于,所述候选相似度包括候选句子相似度和候选关系相似度;根据所述用户问句、所述候选答案句子和所述候选关系名称确定所述候选相似度包括:根据所述用户问句和所述候选答案句子确定所述候选句子相似度;根据所述用户问句和所述候选关系名称确定所述候选关系相似度。4.根据权利要求3所述的基于知识图谱的问答方法,其特征在于,根据所述实体提及相似度和所述候选相似度向用户推送答案包括:根据所述实体提及相似度和所述候选相似度得到候选问题相似度;根据所述候选问题相似度向用户推送答案。5.根据权利要求4所述的基于知识图谱的问答方法,其特征在于,根据所述候选问题相似度向用户推送答案包括:根据所述候选问题相似度确定目标相似度;确定目标相似度对应的候选答案句子为目标答案句...

【专利技术属性】
技术研发人员:孙笛
申请(专利权)人:工银科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1