一种支持双侧悬空实体检测的实体对齐系统及方法技术方案

技术编号:40760934 阅读:19 留言:0更新日期:2024-03-25 20:12
本申请提供了一种支持双侧悬空实体检测的实体对齐系统及方法,所述系统包括:实体嵌入模块,用于引入邻域实体关系信息,基于图卷积思想采用代数方法生成实体嵌入向量;悬空实体检测模块,用于从统计分布角度出发将悬空实体检测转化为实体分类问题,采用3原则实现悬空实体识别,并删除实体集合中的悬空实体;和实体对齐模块,用于在删除悬空实体的基础上,从线性规划角度出发将实体对齐转换为指派问题进行实体的对齐。本申请的优势在于:本申请面向双侧知识图谱均存在悬空实体的场景进行实体集合的实体对齐,实验证明,本申请的技术方案领先于所有对比模型,具有高效性、可解释性和稳定性。

【技术实现步骤摘要】

本申请属于人工智能领域,具体涉及一种支持双侧悬空实体检测的实体对齐系统及方法


技术介绍

1、知识图谱:以基于点和边的图结构反映现实中知识之间的复杂关系,是人工智能的重要基石,在自动问答、搜索引擎、推荐系统等下游任务中有着广泛应用。如何从各自异构的大规模知识图谱中建立统一链接,实现知识图谱间的高效融合,是各应用领域亟待解决的重要问题。

2、实体对齐:是指从不同知识图谱中发现出指代相同事物的实体,是实现知识图谱融合的关键步骤。

3、早期的实体对齐方法通常依赖于单词匹配和概率推理,由于实体包含的信息和所在领域不同,很难给出统一的相似度评价函数,同时该类方法大多着眼于句法和结构,忽略了多方面隐含的语义信息。随后,基于知识表示学习技术凭借拥有将实体语义信息低维稠密向量化的强大的表征能力,将实体字符串、描述、属性、结构等丰富的信息包罗其中,已成为目前解决实体对齐问题的重要方法,其中,基于图神经网络的实体对齐方法以图结构的方式天然契合于描述实体邻接信息,在公开数据集上展现了卓越的性能。但目前研究依然存在以下问题:

>4、1)实体对齐任本文档来自技高网...

【技术保护点】

1.一种支持双侧悬空实体检测的实体对齐系统,其特征在于,所述系统包括:

2.根据权利要求1所述的支持双侧悬空实体检测的实体对齐系统,其特征在于,所述生成实体嵌入向量和的迭代公式为:

3.根据权利要求2所述的支持双侧悬空实体检测的实体对齐系统,其特征在于,所述悬空实体识别的方法包括:

4.根据权利要求3所述的支持双侧悬空实体检测的实体对齐系统,其特征在于,所述实体相似度为实体余弦相似度。

5.根据权利要求3所述的支持双侧悬空实体检测的实体对齐系统,其特征在于,所述实体相似度向量的样本分位数的获取方式为:

6.根据权利要求1所述的支...

【技术特征摘要】

1.一种支持双侧悬空实体检测的实体对齐系统,其特征在于,所述系统包括:

2.根据权利要求1所述的支持双侧悬空实体检测的实体对齐系统,其特征在于,所述生成实体嵌入向量和的迭代公式为:

3.根据权利要求2所述的支持双侧悬空实体检测的实体对齐系统,其特征在于,所述悬空实体识别的方法包括:

4.根据权利要求3所述的支持双侧悬空实体检测的实体对齐系统,其特征在于...

【专利技术属性】
技术研发人员:杨甲森徐聪贾清玉尹中康智佳陈托高翔姚秀娟
申请(专利权)人:中国科学院国家空间科学中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1