基于联合抽取和链接预测的知识图谱构建及补全方法技术

技术编号:42304484 阅读:11 留言:0更新日期:2024-08-14 15:51
本发明专利技术属于本发明专利技术属于知识图谱领域,具体涉及一种基于联合抽取和链接预测的知识图谱构建及补全方法,包括:基于潜在关系检测和条件实体映射的联合实体关系抽取方法用来构建知识图谱;融合图结构信息和多重特征的知识图谱链接预测方法来对抽取阶段生成的知识图谱进行自动补全。本发明专利技术的方法解决了现有知识图谱构建方法在三元组抽取过程中存在的关系冗余、噪声导致的不能准确识别出重叠三元组的问题,以及在知识图谱补全阶段全局特征捕获不充分、未利用图结构信息的问题。

【技术实现步骤摘要】

本专利技术属于知识图谱领域,具体涉及一种基于联合抽取和链接预测的知识图谱构建及补全方法


技术介绍

1、随着信息时代的到来,海量的文本数据不断涌现,如何从海量的数据中提取有用的信息,并将这些信息存储起来是一个重要的挑战。在这个背景下,知识图谱作为一种用于表示和组织结构化知识的强大工具,逐渐引起了广泛关注。

2、知识图谱是一种语义关联、结构化的知识表示方式,以图的形式来表示实体之间的关系。知识图谱中的知识通常被表示为结构化的三元组的形式,一个三元组(h,r,t)就能很好的表示一个事实:头实体h和尾实体t之间存在关系r。这种结构化的表示方式使得计算机能够更好的理解、推理和处理现实世界中的知识。目前,知识图谱被广泛的用于推荐系统、搜素引擎等商业领域。

3、联合抽取可以将构成知识图谱的三元组从文本中抽取出来,是构建知识图谱的有力工具和关键技术。联合抽取通过同时处理多个相关任务,以提高整体抽取性能。通过联合抽取能够更好的捕捉实体和关系之间的复杂语义信息,从而构建出更为准确和丰富的知识图谱。此外,衡量知识图谱质量的一个重要指标是知识图谱的完整度本文档来自技高网...

【技术保护点】

1.一种基于联合抽取和链接预测的知识图谱构建及补全方法,其特征在于,包括:

2.根据权利要求1所述的一种基于联合抽取和链接预测的知识图谱构建及补全方法,其特征在于,将数据集中的文本大数据预处理成可以被BERT所处理的句子,并从语料中收集需要的关系,包括:

3.根据权利要求1所述的一种基于联合抽取和链接预测的知识图谱构建及补全方法,其特征在于,基于潜在关系检测和条件实体映射的联合三元组提取模型进行三元组提取以构建初步的知识图谱,包括:

4.根据权利要求3所述的一种基于联合抽取和链接预测的知识图谱构建及补全方法,其特征在于,完成候选实体标记后使用两个不同的...

【技术特征摘要】

1.一种基于联合抽取和链接预测的知识图谱构建及补全方法,其特征在于,包括:

2.根据权利要求1所述的一种基于联合抽取和链接预测的知识图谱构建及补全方法,其特征在于,将数据集中的文本大数据预处理成可以被bert所处理的句子,并从语料中收集需要的关系,包括:

3.根据权利要求1所述的一种基于联合抽取和链接预测的知识图谱构建及补全方法,其特征在于,基于潜在关系检测和条件实体映射的联合三元组提取模型进行三元组提取以构建初步的知识图谱,包括:

4.根据权利要求3所述的一种基于联合抽取和链接预测的知识图谱构建及补全方法,其特征在于,完成候选实体标记后使用两个不同的序列标记器来识别候选头实体和候选尾实体,包括:

5.根据权利要求3所述的一种基于联合抽取和链接预测的知识图谱构建及补全方法,其特征在于,通过条件层归一化将每个候选头实体和每个潜在关系作为条件连接起来并集成到句子表示中,得到实体映射表示,包括:

6.根据权利要求3所述的一种基于联合抽取和链接预测的知识图谱构建及补全方法,其特征在于,结合实...

【专利技术属性】
技术研发人员:张清华黄帅帅周雄罗南方谢秦
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1