System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大语言模型知识蒸馏的知识图谱构建方法及装置制造方法及图纸_技高网

基于大语言模型知识蒸馏的知识图谱构建方法及装置制造方法及图纸

技术编号:39943326 阅读:7 留言:0更新日期:2024-01-08 22:44
本发明专利技术实施例公开了一种基于大语言模型知识蒸馏的知识图谱构建方法及装置,方法包括:获取元数据;元数据包括知识图谱的关系描述信息以及与关系描述信息对应的多个实体对;将元数据的关系描述信息与实体对进行拼装,得到拼装语句,对拼装语句进行同义改写,提取改写后的拼装语句,得到关系描述集合;关系描述集合包含改写后的拼装语句中的多个关系描述信息;根据关系描述集合以及实体对构建提示词,根据提示词,利用知识蒸馏模块得到候选实体对集合;根据候选实体对集合以及元数据的关系描述信息生成知识图谱。基于元数据快速地从大语言模型中提取、整理和构建候选实体对,实现对知识图谱的更新和扩充,从而高效、可靠、低成本构建知识图谱。

【技术实现步骤摘要】

本专利技术实施例涉及人工智能,具体涉及一种基于大语言模型知识蒸馏的知识图谱构建方法及装置


技术介绍

1、知识图谱作为一种高效的数据组织方式,通过实体、关系、属性等信息,以图结构的方式表示复杂的知识体系,从而为用户提供更为深入、直观的知识检索和探索服务。随着技术发展,知识图谱已经在智能推荐、搜索引擎优化以及人工智能决策支持等领域展现出了其不可替代的价值。

2、然而,传统的基于人工构建知识图谱的方式面临着价格昂贵、构建周期长等缺点。除此之外,在当前的知识飞速发展时代,人工构建方式早已不能满足日益增长的信息需求。如何高效、便捷、低成本地完成知识图谱构建,是一个巨大的挑战。


技术实现思路

1、鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的基于大语言模型知识蒸馏的知识图谱构建方法及装置。

2、根据本专利技术实施例的一个方面,提供了一种基于大语言模型知识蒸馏的知识图谱构建方法,其包括:

3、获取元数据;元数据包括知识图谱的关系描述信息以及与关系描述信息对应的多个实体对;

4、将元数据的关系描述信息与实体对进行拼装,得到拼装语句,对拼装语句进行同义改写,提取改写后的拼装语句,得到关系描述集合;关系描述集合包含改写后的拼装语句中的多个关系描述信息;

5、根据关系描述集合以及实体对构建提示词,根据提示词,利用知识蒸馏模块得到候选实体对集合;

6、根据候选实体对集合以及元数据的关系描述信息生成知识图谱。

7、根据本专利技术实施例的另一方面,提供了一种基于大语言模型知识蒸馏的知识图谱构建装置,装置包括:

8、获取单元,适于获取元数据;元数据包括知识图谱的关系描述信息以及与关系描述信息对应的实体对;

9、改写单元,适于将元数据的关系描述信息与实体对进行拼装,得到拼装语句,对拼装语句进行同义改写,提取改写后的拼装语句,得到关系描述集合;关系描述集合包含改写后的拼装语句中的多个关系描述信息;

10、知识蒸馏单元,适于根据关系描述集合以及实体对构建提示词,根据提示词,利用知识蒸馏模块得到候选实体对集合;

11、生成单元,适于根据候选实体对集合以及元数据的关系描述信息生成知识图谱。

12、根据本专利技术实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

13、所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述基于大语言模型知识蒸馏的知识图谱构建方法对应的操作。

14、根据本专利技术实施例的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述基于大语言模型知识蒸馏的知识图谱构建方法对应的操作。

15、根据本专利技术实施例的提供的基于大语言模型知识蒸馏的知识图谱构建方法及装置,基于元数据快速地从大语言模型中提取、整理和构建候选实体对,实现对知识图谱的更新和扩充,从而高效、可靠、低成本构建知识图谱。

16、上述说明仅是本专利技术实施例技术方案的概述,为了能够更清楚了解本专利技术实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术实施例的具体实施方式。

本文档来自技高网...

【技术保护点】

1.一种基于大语言模型知识蒸馏的知识图谱构建方法,其特征在于,方法包括:

2.根据权利要求1所述的方法,其中,所述方法还包括:

3.根据权利要求2所述的方法,其中,所述基于所述实体对确定所述关系描述集合的各个权重,得到包含权重的关系描述集合进一步包括:

4.根据权利要求2或3所述的方法,其中,所述根据所述关系描述集合以及所述实体对构建提示词进一步包括:

5.根据权利要求4所述的方法,其中,所述利用知识蒸馏模块得到候选实体对集合进一步包括:

6.根据权利要求5所述的方法,其中,所述利用知识蒸馏模块基于少量标注数据方式得到候选实体对集合进一步包括:

7.根据权利要求6所述的方法,其中,在所述根据所述候选实体对集合以及所述元数据的关系描述信息生成知识图谱之前,所述方法还包括:

8.一种基于大语言模型知识蒸馏的知识图谱构建装置,其特征在于,装置包括:

9.一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;</p>

10.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的基于大语言模型知识蒸馏的知识图谱构建方法对应的操作。

...

【技术特征摘要】

1.一种基于大语言模型知识蒸馏的知识图谱构建方法,其特征在于,方法包括:

2.根据权利要求1所述的方法,其中,所述方法还包括:

3.根据权利要求2所述的方法,其中,所述基于所述实体对确定所述关系描述集合的各个权重,得到包含权重的关系描述集合进一步包括:

4.根据权利要求2或3所述的方法,其中,所述根据所述关系描述集合以及所述实体对构建提示词进一步包括:

5.根据权利要求4所述的方法,其中,所述利用知识蒸馏模块得到候选实体对集合进一步包括:

6.根据权利要求5所述的方法,其中,所述利用知识蒸馏模块基于少量标注数据方式得到候选实体对集...

【专利技术属性】
技术研发人员:张凯白昊鹏崔向阳轩占伟仝春艳杨松
申请(专利权)人:人民网股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1