一种知识图谱修正方法及装置制造方法及图纸

技术编号:38596918 阅读:10 留言:0更新日期:2023-08-26 23:32
本申请公开了一种知识图谱修正方法及装置,其中,所述方法包括:基于知识图谱的待修正信息,利用提示学习构造提示模板,其中,所述待提示模板至少包括所述知识图谱中用于提示所述待修正信息的提示信息;利用所述提示模板生成所述知识图谱的待处理内容,其中,所述待处理内容包括至少一条待处理数据,所述待处理内容中至少一条所述待处理数据包括所述待修正信息对应的待修正文本;将所述待处理内容输入预训练语言模型进行搜索,以利用所述提示信息对所述待修正文本进行修正。对所述待修正文本进行修正。对所述待修正文本进行修正。

【技术实现步骤摘要】
一种知识图谱修正方法及装置


[0001]本申请实施例涉及数据处理
,涉及但不限于一种知识图谱修正方法及装置。

技术介绍

[0002]知识图谱被广泛应用在自然语言处理的各项任务中,但知识图谱在构建过程中,因为文档的噪声信息、知识抽取函数自身限制、语言文字本身的有效性信息等等因素,导致了知识图谱的不完整或者信息错误。这些知识的缺失、错误都会给实际的应用带来了很多问题,比如实体间关系或者属性的缺失会导致对实体的描述不详细,影响最优的决策;更甚至实体间错误的关系或属性,会带来对实体错误的认知,给出错误的决策。基于此,找到一种有效且高质量对知识图谱进行补全纠错的方法来完善图谱很有必要。

技术实现思路

[0003]有鉴于此,本申请实施例提供一种知识图谱修正方法、装置、设备及存储介质。
[0004]本申请实施例的技术方案是这样实现的:
[0005]第一方面,本申请实施例提供一种知识图谱修正方法,所述方法包括:
[0006]基于知识图谱的待修正信息,利用提示学习构造提示模板,其中,所述待提示模板至少包括所述知识图谱中用于提示所述待修正信息的提示信息;
[0007]利用所述提示模板生成所述知识图谱的待处理内容,其中,所述待处理内容包括至少一条待处理数据,所述待处理内容中至少一条所述待处理数据包括所述待修正信息对应的待修正文本;
[0008]将所述待处理内容输入预训练语言模型进行搜索,以利用所述提示信息对所述待修正文本进行修正。
[0009]第二方面,本申请实施例提供一种知识图谱修正装置,所述装置包括:
[0010]构造模块,用于基于知识图谱的待修正信息,利用提示学习构造提示模板,其中,所述待提示模板至少包括所述知识图谱中用于提示所述待修正信息的提示信息;
[0011]生成模块,用于利用所述提示模板生成所述知识图谱的待处理内容,其中,所述待处理内容包括至少一条待处理数据,所述待处理内容中至少一条所述待处理数据包括所述待修正信息对应的待修正文本;
[0012]修正模块,用于将所述待处理内容输入预训练语言模型进行搜索,以利用所述提示信息对所述待修正文本进行修正。
[0013]第三方面,本申请实施例提供一种电子设备,包括存储器和至少一个处理器,所述存储器存储有可在至少一个处理器上运行的计算机程序,所述至少一个处理器执行所述程序时实现上述方法。
[0014]第四方面,本申请实施例提供一种存储介质,存储有可执行指令,用于处理器执行时,实现上述方法。
[0015]本申请实施例中,首先基于知识图谱的待修正信息,利用提示学习构造提示模板;然后利用所述提示模板生成所述知识图谱的待处理内容;最后将所述待处理内容输入预训练语言模型进行搜索,以利用所述提示信息对所述待修正文本进行修正。这样,由于提示学习可以在给定一些合适提示的条件下,通过预训练语言模型可以自动化的对缺失信息进行补充或者对错误信息进行纠错,所以利用提示学习构造合适的提示模板,可以实现少样本甚至零样本的学习,实现修正知识图谱中的待修正信息。
附图说明
[0016]图1A为本申请实施例提供的一种知识图谱修正方法的实现流程示意图;
[0017]图1B为本申请实施例提供的一种人物关系知识图谱的示意图;
[0018]图1C为本申请实施例提供的一种人物关系知识图谱的示意图;
[0019]图2为本申请实施例提供的一种生成待处理内容的实现流程示意图;
[0020]图3为本申请实施例提供的一种修正待修正文本的实现流程示意图;
[0021]图4A为本申请实施例提供的一种知识图谱修正方法的实现流程示意图;
[0022]图4B为本申请实施例提供的一种利用大规模预训练模型搜索待修正文本对应答案的示意图;
[0023]图5为本申请实施例提供的一种知识图谱修正装置的组成结构示意图;
[0024]图6为本申请实施例提供的电子设备的一种硬件实体示意图。
具体实施方式
[0025]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对申请实施例的具体技术方案做进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
[0026]在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
[0027]在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
[0028]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
[0029]对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
[0030]本申请实施例提供一种知识图谱修正方法,如图1A所示,该方法包括:
[0031]步骤S110、基于知识图谱的待修正信息,利用提示学习构造提示模板,其中,所述待提示模板至少包括所述知识图谱中用于提示所述待修正信息的提示信息;
[0032]知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射
地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
[0033]这里,知识图谱可以用于描述真实世界中存在的各种实体和概念,以及它们之间的关系,即一种语义网络。知识图谱是在自然语言处理(Natural Language Processing,NLP)的基础上发展而来,与NPL有密切的联系。其基本组成单位是“实体

关系

实体”三元组,以及实体及其相关属性,实体间通过关系相互联结,构成网状的知识结构。同时每个节点代表的实体还存在着一些属性。举例来说,“小姚,效力于,NBA”为“实体

关系

实体”三元组;“小姚,身高,2.29m”为“小姚

属性

属性值”。
[0034]知识图谱在构建过程中,因为文档的噪声信息、知识抽取函数自身限制、语言文字本身的有效性信息等等因素,导致了知识图谱的不完整或者信息错误。在实施过程中,可以首先确定知识图谱中出现错误风险较高的信息为待修正信息。举例来说,如图1B所示,可以确定一个知识图谱中“有孩子/没有孩子”的属性信息为待修正信息。
[0035]提示学习,可以不改变预训练语言模型的结构和参数,不需要针对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱修正方法,所述方法包括:基于知识图谱的待修正信息,利用提示学习构造提示模板,其中,所述待提示模板至少包括所述知识图谱中用于提示所述待修正信息的提示信息;利用所述提示模板生成所述知识图谱的待处理内容,其中,所述待处理内容包括至少一条待处理数据,所述待处理内容中至少一条所述待处理数据包括所述待修正信息对应的待修正文本;将所述待处理内容输入预训练语言模型进行搜索,以利用所述提示信息对所述待修正文本进行修正。2.如权利要求1所述的方法,所述基于知识图谱的待修正信息,利用提示学习构造提示模板,包括:基于知识图谱的待修正信息,确定任务类型;基于所述任务类型和所述提示信息构造所述提示模板。3.如权利要求1所述的方法,所述利用所述提示模板生成所述知识图谱的待处理内容,包括:将所述知识图谱中已有的节点关系或属性信息根据所述提示模板进行文本化表示,得到所述知识图谱的候选数据;将所述候选数据之间语义相似度满足预设要求的候选数据确定为所述待处理数据;拼接所述待处理数据,得到所述待处理内容。4.如权利要求3所述的方法,所述方法还包括:将所述候选数据映射至向量空间,得到所述候选数据对应的候选向量;对应地,所述将所述候选数据之间语义相似度满足预设要求的所述候选数据确定为所述待处理数据,包括:在所述向量空间中,将与所述候选向量之间满足距离阈值的所述候选向量确定为目标候选向量;将所述目标候选向量对应的候选数据确定为所述待处理数据。5.如权利要求1所述的方法,所述将所述待处理内容输入预训练语言模型进行搜索,以利用所述提示信息对所述待修正文本进行修正,包括:逐一对所述待处理内容中的每一待处理数据中的待修正文本进行掩码处理;逐一将完成掩码处理的待处理内容输入所述预训练语言模型,利用所述提示信息对完成掩码处理的待处理数据中的待修正文本进行修正,实现对所述待处理内容中的每一所述待处理数据中的待修正文本进行修正。6.如权利要求5所述的方法,所述逐一将完成掩码处理的待处理内容输入所述预训练语言模型,利用所述提示信息对完成掩码处理的待处理数据中的待修正文本进行修正,包括:在所述待处理内容包括一条所述待处理数据的情况下,将完成掩码处理的待处理数据输...

【专利技术属性】
技术研发人员:邹丹叶偲朱琴
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1