基于大语言模型的工业知识图谱补全与自适应检索方法技术

技术编号:44133722 阅读:123 留言:0更新日期:2025-01-24 22:54
本发明专利技术公开了基于大语言模型的工业知识图谱补全与自适应检索方法,属于计算机技术领域,将残缺知识图谱划分多个子图,通过负样本过滤、邻域信息剪枝、信息合并、问答模板映射以及构建知识图谱补全大模型并进行LoRA微调,补全知识图谱,通过自适应检索查询模块接收用户问题、任务分解、实体探索、关系探索、更新记忆子模块中的子图、推理路径和子目标状态,并评估性能输出查询结果,在反思与自我矫正中,当信息不足时,LLM会基于当前信息评估是否需要调整探索方向或修正推理路径,最终,根据检索到的信息输出满足用户需求的答案。本发明专利技术有效地结合了大语言模型的能力,通过自适应检索和反思机制,提高了知识图谱补全的效率和准确性。

【技术实现步骤摘要】

本专利技术属于计算机,具体涉及基于大语言模型的工业知识图谱补全与自适应检索方法


技术介绍

1、在工业场景中,知识图谱作为一种结构化的知识表示方式,广泛应用于推荐系统、语义搜索、智能问答等领域。然而,知识图谱往往存在不完整性问题,需要通过知识图谱补全技术来预测和添加缺失的实体和关系。传统的知识图谱补全方法主要依赖于图结构信息,如知识图谱嵌入技术,但这些方法在处理稀疏性和可扩展性问题时存在局限。近年来,随着大语言模型(llm,large language model)的发展,研究者开始探索利用这些模型强大的语言理解和生成能力来增强知识图谱的补全效果。llm能够通过上下文学习实体和关系的语义信息,从而提高补全的准确性。然而,现有的研究在如何有效地整合llm的推理能力和知识图谱的结构化信息方面仍存在不足,特别是在处理工业场景中的复杂查询和动态更新知识图谱时,需要更灵活和自适应的规划方法。

2、此外,现有的知识图谱补全方法在处理大规模和动态变化的工业数据时,面临着计算效率和实时性的挑战。同时,llm在知识图谱上的推理过程中可能产生错误的路径或不准确的预本文档来自技高网...

【技术保护点】

1.基于大语言模型的工业知识图谱补全与自适应检索方法,其特征在于包括如下步骤:

2.根据权利要求1所述的基于大语言模型的工业知识图谱补全与自适应检索方法,其特征在于:所述步骤2的知识图谱补全,包括如下步骤:

3.根据权利要求2所述的基于大语言模型的工业知识图谱补全与自适应检索方法,其特征在于:所述步骤2.1中,首先构建以实体为中心的知识图谱邻域子图,包含所有与直接相关的实体和关系,然后,从中筛选出与和特定关系相关的三元组集合,接着,从中移除正确的三元组,得到负样本集合;

4.根据权利要求2所述的基于大语言模型的工业知识图谱补全与自适应检索方法,其特征在...

【技术特征摘要】

1.基于大语言模型的工业知识图谱补全与自适应检索方法,其特征在于包括如下步骤:

2.根据权利要求1所述的基于大语言模型的工业知识图谱补全与自适应检索方法,其特征在于:所述步骤2的知识图谱补全,包括如下步骤:

3.根据权利要求2所述的基于大语言模型的工业知识图谱补全与自适应检索方法,其特征在于:所述步骤2.1中,首先构建以实体为中心的知识图谱邻域子图,包含所有与直接相关的实体和关系,然后,从中筛选出与和特定关系相关的三元组集合,接着,从中移除正确的三元组,得到负样本集合;

4.根据权利要求2所述的基于大语言模型的工业知识图谱补全与自适应检索方法,其特征在于:所述步骤2.3中,从三元组中提取了负样本集和邻域信息集c(e, p),c(e, p)表示以e为中心,深度为p的上下文邻域信息集,并设定了上下文信息集的数量m,对于每个三元组,根据负样本集的大小来确定最终信息集:若负样本集的大小大于等于m,从中随机选取m个样本;如果小于m,从邻域信息集中补充样本,直到总数达到m,最终信息集d(e,m)包括调整后的负样本集和补充的邻域信息集,如果负样本集的大小已经达到m,则邻域信息集将不包含在内。

5.根据权利要求2所述的基于大语言模型的工业知识图谱补全与自适应检索方法,其特征在于:所述步骤2.4中,对于缺失的三元组(h, r, ?),h表示主体,构建基本模板;对于g中的...

【专利技术属性】
技术研发人员:章东平刘萱马道滨卜玉真余家斌
申请(专利权)人:中国计量大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1