当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于知识图谱的文本信息匹配方法、装置及相关设备制造方法及图纸

技术编号:33294401 阅读:38 留言:0更新日期:2022-05-01 00:20
本申请公开了一种基于知识图谱的文本信息匹配方法、装置及相关设备,所述方法包括:通过双向长短期记忆神经网络LSTM模型对目标文本进行实体识别,得到节点集合;根据所述节点集合和预设的知识图谱,构建查询图;将所述查询图输入至训练后的图注意力网络模型,得到所述查询图中各节点的嵌入表示;根据所述知识图谱中各节点的嵌入表示和所述查询图中各节点的嵌入表示,确定所述查询图中各节点所对应的目标实体信息。本申请通过LSTM模型能够很好地捕捉目标文本的上下文关系,并充分利用了已有的知识图谱中的结构信息来匹配目标文本信息中的实体,以及通过训练后的图注意力网络来提高匹配的准确度,使得能够较为准确地获取目标文本的语义信息。文本的语义信息。文本的语义信息。

【技术实现步骤摘要】
一种基于知识图谱的文本信息匹配方法、装置及相关设备


[0001]本申请涉及文本信息处理领域,更具体地说,是涉及一种基于知识图谱的 文本信息匹配方法、装置及相关设备。

技术介绍

[0002]最近几年,医学知识图谱获得了不少的进步。生物医学知识图谱资料主要 来自于健康护理数据,例如临诊资源,电子健康数据,生物医学文献和实验测 试。医学知识图谱有助于提供高质量的信息以方便临床诊断。例如通过医学知 识图谱很方便就能构建一个医学知识问答的应用。实体消歧是构建知识图谱 的一个基本任务。一个实体在不同的上下文表现出不同的含义,实体消岐旨在 获取实体在具体上下文中的准确含义。
[0003]然而,由于原文档的句子与知识图谱的实体存在差异,目前的医学实体消 歧方法在这方面做得还不够好。医学实体消歧是指如何把出现在文本段的实 体识别映射到对应的在知识图谱的实体。这些输入的医疗数据文本段通常也 是收集于与知识图谱相同结构的数据资源。但是在这个过程中,由于缩略词, 拼写错误和口语,文本段的实体会与知识图谱对应的实体显示出差异。例如在 英文医学知识图谱,对于肾病这本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的文本信息匹配方法,其特征在于,包括:通过双向长短期记忆神经网络LSTM模型对目标文本进行实体识别,得到节点集合,所述节点集合中的每一节点对应于一实体以及实体类型;根据所述节点集合和预设的知识图谱,构建查询图,所述查询图包含所述节点集合中各节点之间的连边关系;将所述查询图输入至训练后的图注意力网络模型,得到所述查询图中各节点的嵌入表示;根据所述知识图谱中各节点的嵌入表示和所述查询图中各节点的嵌入表示,确定所述查询图中各节点所对应的目标实体信息;其中,所述知识图谱中各节点的嵌入表示为通过预先将所述知识图谱输入至所述训练后的图注意力网络模型计算得到。2.根据权利要求1所述的方法,其特征在于,根据所述节点集合和预设的知识图谱,构建查询图的过程,包括:将所述节点集合划分为目标节点集合与候选节点集合,所述目标节点集合中各节点包含在所述预设的知识图谱中,所述候选节点集合中任意节点均不包含在所述预设的知识图谱中;根据所述目标节点集合、所述候选节点集合以及所述预设的知识图谱,构建查询图。3.根据权利要求2所述的方法,其特征在于,根据所述目标节点集合、所述候选节点集合以及所述预设的知识图谱,构建查询图的过程,包括:对于所述目标节点集合中的每一节点对,若所述节点对在所述知识图谱中存在连边,则以所述节点对和所述连边的类型作为一条连边记录,添加到目标连边集合;根据所述候选节点集合和所述知识图谱,确定候选连边集合,所述候选连边集合中每一连边的至少一个节点的实体类型包含在所述候选节点集合中;对于所述知识图谱的每一节点:若所述节点存在连边,且所述连边的类型包含在所述候选连边集合中,则将所述节点的实体类型添加到实体类型集合中;根据所述候选连边集合、所述实体类型集合、所述目标节点集合,更新所述目标连边集合;其中,以所述目标节点集合以及所述目标连边集合构成所述查询图。4.根据权利要求3所述的方法,其特征在于,根据所述候选节点集合和所述知识图谱,确定候选连边集合的过程,包括:对于所述候选节点集合中的每一节点:获取所述节点所对应的实体类型;从所述知识图谱中确定与所述实体类型的节点相连的连边;以所述连边的类型,以及构成所述连边的节点及节点的实体类型作为一条连边记录,添加到候选连边集合中。5.根据权利要求3所述的方法,其特征在于,根据所述候选连边集合、所述实体类型集合、所述目标节点集合,更新所述目标连边集合的过程,包括:对于所述目标节点集合中的每一节点:若所述节点的实体类型包含在...

【专利技术属性】
技术研发人员:刘玉葆李绍基
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1