一种知识融合方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40079166 阅读:23 留言:0更新日期:2024-01-17 02:13
本申请提供了一种知识融合方法、装置、电子设备及存储介质,首先基于相似度匹配粗筛得到潜在匹配序列对,进一步结合词向量建模技术并使用双塔神经网络模型精筛确定重复的实体结构数据,进而融合得到更新知识图谱。这样,通过结合前沿双塔神经网络和传统的自然语言技术,能够更准确地匹配实体结构数据,从而实现知识的准确高效融合,更新得到更准确的知识图谱。

【技术实现步骤摘要】

本申请涉及知识图谱,尤其是涉及一种知识融合方法、装置、电子设备及存储介质


技术介绍

1、知识融合技术是在知识图谱构建和应用中的一项关键技术。在现代信息时代,知识来源广泛且结构各异,包括结构化数据库、半结构化文本、非结构化文本等多种形式。然而,这些知识源之间存在着差异和异构性,导致知识的分布和不一致性。构建完善而准确的知识图谱需要不断收集来自不同知识源并且对知识图谱中的存储信息进行更新和补充。因此,知识融合算法在图谱更新阶段至关重要,直接影响到知识图谱的内容质量和存储效率。

2、现有的知识融合方法往往基于简单的逻辑规则、统计方法或传统的机器学习技术进行。然而,现有的融合方法在处理大规模、异构和高度动态的知识时往往表现不佳,无法有效地将不同来源的知识进行集成,导致融合结果的准确性和完整性受到限制。其次,由于知识和数据的来源多样性,不同来源之间可能存在冲突和不一致性;而现有的融合方法无法很好地解决复杂的冲突和不一致性情况,导致融合结果的可靠性受到威胁。最后,现有的融合方法通常是基于静态的规则和模型进行,但静态方法缺乏自适应和可扩展性。随着知识和数据本文档来自技高网...

【技术保护点】

1.一种知识融合方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将每组实体结构数据对应的实体文本和词向量输入预先构建的双塔神经网络模型,确定该潜在匹配序列对包括的每组实体结构数据是否重复,包括:

3.根据权利要求1或2任一所述的方法,其特征在于,所述双塔神经网络模型包括两个分支结构和全连接层;每个分支结构包括词嵌入层、拼接层和表示层;所述双塔神经网络模型的两个分支结构的表示层之间共享权重;

4.根据权利要求1所述的方法,其特征在于,所述根据每个潜在匹配序列对包括的每组实体结构数据是否重复的确定结果,融合所述待更新实体结构...

【技术特征摘要】

1.一种知识融合方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将每组实体结构数据对应的实体文本和词向量输入预先构建的双塔神经网络模型,确定该潜在匹配序列对包括的每组实体结构数据是否重复,包括:

3.根据权利要求1或2任一所述的方法,其特征在于,所述双塔神经网络模型包括两个分支结构和全连接层;每个分支结构包括词嵌入层、拼接层和表示层;所述双塔神经网络模型的两个分支结构的表示层之间共享权重;

4.根据权利要求1所述的方法,其特征在于,所述根据每个潜在匹配序列对包括的每组实体结构数据是否重复的确定结果,融合所述待更新实体结构数据和所述原始知识图谱,得到更新知识图谱,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据每个潜在匹配序列对包括的每组实体结构数据是否重复的确定结果,确定所述至少一组待更新实体结构数据中的目标实体结构数据和...

【专利技术属性】
技术研发人员:李劼翔贺亮徐向上戚瀚中
申请(专利权)人:中电金信软件上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1