基于LangGraph工作流的知识图谱自动化构建系统和方法技术方案

技术编号:46618908 阅读:0 留言:0更新日期:2025-10-14 21:14
本发明专利技术公开了一种基于LangGraph工作流的知识图谱自动化构建系统和方法,涉及知识图谱领域,包括:多源异构数据获取模块,用于根据名称列表获取目标实体的维基百科的非结构化文本数据和Wikidata的结构化属性数据;知识抽取与图构建模块,用于基于LangGraph工作流对维基百科的非结构化文本数据进行知识抽取与图构建以得到初步图谱结构并将其存入图数据库中;Wikidata结构化属性集成模块,用于根据Wikidata的结构化属性数据,得到中间图谱结构;实体融合与消歧处理模块,用于在图数据库中对中间图谱结构进行实体融合与消歧处理得到最终知识图谱结构。本发明专利技术提高了知识图谱构建的准确性和自动化程度。

【技术实现步骤摘要】

本专利技术涉及知识图谱,尤其涉及一种基于langgraph工作流的知识图谱自动化构建系统和方法。


技术介绍

1、知识图谱作为一种结构化的知识库,用以描述现实世界中的概念、实体及其相互关系,已在搜索引擎、智能问答、推荐系统等领域得到广泛应用。从维基百科这类半结构化或非结构化文本中抽取信息以构建知识图谱,是知识工程领域的重要研究方向。早期的知识图谱构建主要依赖人工编辑或基于规则的方法。随着自然语言处理(nlp)技术的发展,出现了基于机器学习的方法,如命名实体识别(ner)、关系抽取(re)等。这些方法通常需要大量标注数据,并且对于复杂语境和隐式关系的理解能力有限。

2、近年来,大型语言模型(大语言模型),如基于transformer架构的模型(gpt系列、bert等),在自然语言理解和生成方面取得了显著进展。它们能够直接从文本中提取实体和关系,甚至生成结构化的输出。这为自动化知识图谱构建提供了新的途径。然而,llm的输出并非总是准确可靠,其生成的内容可能存在事实性错误或不符合预设模式的情况。


技术实现思路

本文档来自技高网...

【技术保护点】

1.一种基于LangGraph工作流的知识图谱自动化构建系统,其特征在于,包括:

2.根据权利要求1所述的基于LangGraph工作流的知识图谱自动化构建系统,其特征在于,知识抽取与图构建模块包括:

3.根据权利要求2所述的基于LangGraph工作流的知识图谱自动化构建系统,其特征在于,对每个目标实体对应的候选关系字典中的每一条关系进行基于预设的大语言模型的关系审查,得到每个目标实体对应的最终实体字典和最终关系字典,具体包括:

4.根据权利要求3所述的基于LangGraph工作流的知识图谱自动化构建系统,其特征在于,知识抽取与图构建模块还包括:错误判...

【技术特征摘要】

1.一种基于langgraph工作流的知识图谱自动化构建系统,其特征在于,包括:

2.根据权利要求1所述的基于langgraph工作流的知识图谱自动化构建系统,其特征在于,知识抽取与图构建模块包括:

3.根据权利要求2所述的基于langgraph工作流的知识图谱自动化构建系统,其特征在于,对每个目标实体对应的候选关系字典中的每一条关系进行基于预设的大语言模型的关系审查,得到每个目标实体对应的最终实体字典和最终关系字典,具体包括:

4.根据权利要求3所述的基于langgraph工作流的知识图谱自动化构建系统,其特征在于,知识抽取与图构建模块还包括:错误判断单元和错误处理单元;

5.根据权利要求1所述的基于langgraph工作流的知识图谱自动化构建系统,其特征在于,wikidata的结构化属性数据包括该目标实体的标准标签、简要描述、常用别名、描述性属性和关系型属性;

6.根据权利要求5所述的基于langgraph工作流的知识图谱自动化构建系统,其特征在于,每个目标实体的wikidata的结构化属...

【专利技术属性】
技术研发人员:张新宇陈伟健陈佳佳邱阳王玮琦董文祥何刘飞
申请(专利权)人:数据空间研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1