实体提及识别模块和的链接方法、装置、设备和介质制造方法及图纸

技术编号:37051151 阅读:16 留言:0更新日期:2023-03-29 19:28
本说明书实施方式提供了一种实体提及识别模块和的链接方法、装置、设备和介质。所述实体提及识别模块包括:向量生成层,用于对应输入的实体提及,生成提及特征向量;向量匹配层,用于将所述提及特征向量与指定特征向量集合中的特征向量进行向量匹配运算,得到所述提及特征向量的关联特征向量;其中,所述关联特征向量表示的实体与所述提及特征向量表示的实体至少相近似;向量识别层,用于基于所述提及特征向量对所述关联特征向量进行识别,输出识别结果;其中,所述识别结果包括表示关联特征向量与所述提及特征向量表达相同实体的第一识别结果,或,表示关联特征向量与所述提及特征向量表达不相同实体的第二识别结果。可以实现提升知识图谱的构建效率。现提升知识图谱的构建效率。现提升知识图谱的构建效率。

【技术实现步骤摘要】
实体提及识别模块和的链接方法、装置、设备和介质


[0001]本说明书中实施方式涉及知识图谱数据处理领域,具体涉及一种实体提及识别模块和的链接方法、装置、设备和介质。

技术介绍

[0002]知识图谱可以将知识数据可视化,以便于对于知识数据的学习和使用。具体的,例如,知识图谱在医学知识领域得到了较多的使用。如此,可以促进医学领域的知识研究。
[0003]现有技术中,知识图谱的构建,主要是基于专家人工处理。具体的,例如,可以收集某一个领域的相关医学知识,该领域的专家人员依照经验,构建多元组数据,进而基于多元组数据建立知识图谱。
[0004]然而,这种知识图谱的构建方式,需要耗费大量人力,导致效率较低。

技术实现思路

[0005]本说明书中多个实施方式提供一种实体提及识别模块和的链接方法、装置、设备和介质。可以一定程度上,提升知识图谱的构建效率。
[0006]本说明书的一个实施方式提供一种实体提及识别模块,所述实体提及识别模块包括:向量生成层,用于对应输入的实体提及,生成提及特征向量;向量匹配层,用于将所述提及特本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种实体提及识别模块,其特征在于,所述实体提及识别模块包括:向量生成层,用于对应输入的实体提及,生成提及特征向量;向量匹配层,用于将所述提及特征向量与指定特征向量集合中的特征向量进行向量匹配运算,得到所述提及特征向量的关联特征向量;其中,所述关联特征向量表示的实体与所述提及特征向量表示的实体至少相近似;向量识别层,用于基于所述提及特征向量对所述关联特征向量进行识别,输出识别结果;其中,所述识别结果包括表示关联特征向量与所述提及特征向量表达相同实体的第一识别结果,或,表示关联特征向量与所述提及特征向量表达不相同实体的第二识别结果。2.根据权利要求1所述的实体提及识别模块,其特征在于,所述向量生成层包括:分词单元,用于将所述实体提及进行分词处理得到多个分词;向量构建单元,用于分别构建每个所述分词的分词特征向量;融合单元,用于将所述实体提及的多个分词的分词特征向量进行融合,得到所述提及特征向量。3.根据权利要求1所述的实体提及识别模块,其特征在于,所述向量匹配层在进行向量匹配运算的过程中,对应所述关联特征向量生成有表示所述关联特征向量与所述提及特征向量的匹配程度的匹配度;所述向量识别层包括:实体向量获取单元,用于从所述指定特征向量集合的特征向量中获取与所述关联特征向量存在依附关系的依附特征向量,和所述依附特征向量与所述关联特征向量之间的关系数据;其中,所述依附特征向量包括:所述关联特征向量在所述指定特征向量集合中所处节点的父节点和/或子节点的特征向量,或者,在所述指定特征向量集合中指定的指定特征向量;图嵌入向量建立单元,用于使用所述关联特征向量、所述依附特征向量和所述关系数据建立图嵌入特征向量;输出单元,用于将所述提及特征向量、所述图嵌入特征向量和所述匹配度,输入指定分类器得到所述识别结果。4.根据权利要求1所述的实体提及识别模块,其特征在于,所述向量匹配层包括:识别单元,用于将所述提及特征向量和所述关联特征向量,依照指定规则树规定的匹配条件进行匹配运算得出所述识别结果;其中,所述指定规则树包括划分多个层级的多个规则节点和依附于规则节点的叶子节点,每个规则节点包括匹配条件,所述叶子节点用于表示所依附的规则节点的匹配条件输出的识别结果。5.一种实体提及的链接方法,其特征在于,所述方法包括:接收实体提及;以知识图谱作为所述指定特征向量集合,将所述实体提及输入至如权利要求1至4中任一所述的实体提及识别模块,得到所述实体提及识别模块输出的识别结果;在所述知识图谱中不存在与所述提及特征向量表达相同实体的目标关联特征向量的情况下,将所述提及特征向量链接入所述知识图谱。6.根据权利要求5所述的方法,其特征在于,所述实体提及的数量为多个;所述方法还包括:将多个实体提及分别输入所述实体提及识别模块的向量生成层,得到多个提及特征量向量;
将所述多个提及特征向量作为所述指定特征向量集合,分别将提及特征向量输入至所述向量匹配层和所述向量识别层,得到识别结果;基于所述识别结果,将多个提及特征向量中表示相同实体的目标候选提及特征向量分别融合为一个提及特征向量。7.根据权利要求5所述的方法,其特征在于,所述方法还包括:在所...

【专利技术属性】
技术研发人员:鲁新新张浩马朋坤马瑞祥李天宁
申请(专利权)人:阿里健康科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1