System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
所属的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。根据本申请的这种实施方式的电子设备。电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:上述至少一个处理器、上述至少一个储存器、连接不同系统组件(包括储存器和处理器)的总线。其中,储存器存储有程序代码,程序代码可以被处理器执行,使得处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。储存器可以包括易失性储存器形式的可读介质,例如随机存取储存器(ram)和/或高速缓存储存器,还可以进一步包括只读储存器(rom)。储存器还可以包括具有一组(至少一个)程序模块的程序/实用工具,这样的程序模块包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。总线可以为表示几类总线结构中的一种或多种,包括储存器总线或者储存器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。电子设备也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备交互的设备通信,和/或与使得该电子设备能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通
技术介绍
1、现有的知识图谱构建技术主要利用传统的基于规则的方法,或是采用深度学习模型从半结构化或非结构化数据中抽取实体、关系、属性、事件等知识实现知识图谱构建。信息抽取的原理是根据上下文信息和语法结构,推断出实体之间的关系。然而,由于自然语言的多样性和灵活性,不同词汇可能表达相同的关系;关系在不同领域的不同的表达方式也可能导致模型无法在一段文本中准确识别关系。这些问题会降低抽取结果的质量。
技术实现思路
1、本申请要解决的技术问题为:如何能够提高用于构建知识图谱的信息的抽取结果的质量。
2、针对上述技术问题,根据本申请的第一方面,提供了一种基于大语言模型的知识图谱构建方法,包括:
3、s100,获取标注数据组集bz;
4、s200,根据bz和预设数据结构,得到初始预训练语言模型的当前评分;
5、s300,若当前评分小于预设分数阈值,则获取非结构化数据集fz=(fz1,fz2,...,fzi,...,fzj);i=1,2,...,j;其中,j为非结构化数据的数量;fzi为非结构化数据集中的第i个非结构化数据;
6、s400,根据上述初始预训练语言模型和fz,得到信息抽取结果集cj=(cj1,cj2,...,cji,...,cjj);其中,cji为根据中间预训练语言模型对fzi进行信息抽取得到的信息抽取结果;每一本文档来自技高网...
【技术保护点】
1.一种基于大语言模型的知识图谱构建方法,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型的知识图谱构建方法,其特征在于,所述预设数据结构是根据待构建知识图谱的三元组框架确定的。
3.根据权利要求2所述的基于大语言模型的知识图谱构建方法,其特征在于,标注数据组集中的每一标注数据组包括原始文本,预设数据结构和目标信息结构;标注数据组集包括第一标注数据组子集和第二标注数据组子集;所述步骤S200包括:
4.根据权利要求1所述的基于大语言模型的知识图谱构建方法,其特征在于,所述步骤S500包括:
5.根据权利要求4所述的基于大语言模型的知识图谱构建方法,其特征在于,所述提示学习采用BROKE框架。
6.根据权利要求4所述的基于大语言模型的知识图谱构建方法,其特征在于,所述步骤S700包括:
7.根据权利要求6所述的基于大语言模型的知识图谱构建方法,其特征在于,所述初始抽取结果为json格式。
8.一种基于大语言模型的知识图谱构建装置,其特征在于,包括:
9.一种非瞬时性计算机可读存
10.一种电子设备,其特征在于,包括处理器和权利要求7中所述的非瞬时性计算机可读存储介质。
...【技术特征摘要】
1.一种基于大语言模型的知识图谱构建方法,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型的知识图谱构建方法,其特征在于,所述预设数据结构是根据待构建知识图谱的三元组框架确定的。
3.根据权利要求2所述的基于大语言模型的知识图谱构建方法,其特征在于,标注数据组集中的每一标注数据组包括原始文本,预设数据结构和目标信息结构;标注数据组集包括第一标注数据组子集和第二标注数据组子集;所述步骤s200包括:
4.根据权利要求1所述的基于大语言模型的知识图谱构建方法,其特征在于,所述步骤s500包括:
5.根据权利要求4所述的基于大语言模型的知识图谱构建方法,其特征在于,所述...
【专利技术属性】
技术研发人员:俞笑,王磊,王柯淇,冯昊,王宇琪,王童跃,黄宇新,孔庆超,
申请(专利权)人:航空工业信息中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。