【技术实现步骤摘要】
知识图谱的生成方法和装置、存储介质及电子设备
[0001]本申请涉及计算机领域,具体而言,涉及一种知识图谱的生成方法和装置、存储介质及电子设备。
技术介绍
[0002]在传统的知识图谱构建过程中,通常是基于pipeline框架来实现。具体地,对不同来源的知识文本语料进行统一处理,再对处理后的语料进行实体识别,得到知识图谱中的实体对象。然后,利用关系抽取模型来提取文本语料中实体对象之间的对应关系。最后再对上述识别提取得到的结果(即多个异源异构的知识子图谱)进行知识图谱融合,从而得到更大规模、更广覆盖度的知识图谱。
[0003]然而,上述基于pipeline框架来构建知识图谱的方式中,构建步骤之间具有一定依赖性。即,在基于语料识别出的实体对象出现错误的话,后续抽取出的实体对象之间的对应关系也会出现错误,这样整个知识图谱构建过程将会出现错误传递并累积的情况,导致所构建出的知识图谱的质量难以保证。进一步,如果想要对上述出错的知识图谱进行纠错,则需对整个知识图谱进行重新梳理调整,存在纠错成本较高的问题。
[0004]也 ...
【技术保护点】
【技术特征摘要】
1.一种知识图谱的生成方法,其特征在于,包括:获取任务提示信息,其中,所述任务提示信息中包括实体识别任务的任务描述信息,以及将要执行所述实体识别任务的目标文本;通过基于自然语言处理模型所构建的实体识别模型,对所述目标文本进行实体识别,以得到所述目标文本中包含的对象实体及所述对象实体之间的关联关系,其中,所述实体识别模型是利用任务文本语料对初始化的所述自然语言处理模型进行训练得到的,所述任务文本语料中包括用于确定对象实体之间不同的关联关系的任务指令;基于从所述目标文本中识别出的所述对象实体及所述对象实体之间的关联关系,生成与所述目标文本匹配的知识图谱。2.根据权利要求1所述的方法,其特征在于,所述通过基于自然语言处理模型所构建的实体识别模型,对所述目标文本进行实体识别,以得到所述目标文本中包含的对象实体及所述对象实体之间的关联关系包括:在所述实体识别模型中识别出所述目标文本中所包含的所述对象实体;在识别出的所述对象实体的数量大于等于2的情况下,在所述实体识别模型中识别出所述对象实体之间的所述关联关系;基于识别出的所述对象实体及所述关联关系,构建实体关系三元组,得到与所述目标文本相匹配的实体关系集;将所述实体关系集作为所述实体识别模型的输出结果。3.根据权利要求2所述的方法,其特征在于,所述基于从所述目标文本中识别出的所述对象实体及所述对象实体之间的关联关系,生成与所述目标文本匹配的知识图谱包括:为识别出的所述对象实体创建各自对应的图谱节点;将识别出的所述对象实体依次作为当前对象实体,并对所述当前对象实体执行以下操作:从所述实体关系集中确定出包含所述当前对象实体的N个实体关系三元组,其中,所述N为大于等于1的正整数;按照所述N个实体关系三元组各自所指示的所述关联关系,连接所述当前对象实体对应的图谱节点和与所述当前对象实体具有所述关联关系的候选对象实体对应的候选图谱节点;在所述当前对象实体并非识别出的所述对象实体中的最后一个对象实体的情况下,获取下一个对象实体作为所述当前对象实体;在所述当前对象实体为识别出的所述对象实体中的最后一个对象实体的情况下,确定生成与所述目标文本匹配的所述知识图谱。4.根据权利要求3所述的方法,其特征在于,所述按照所述N个实体关系三元组各自所指示的关联关系,连接所述当前对象实体对应的图谱节点和与所述当前对象实体具有所述关联关系的候选对象实体所对应的候选图谱节点包括:将所述N个实体关系三元组中的每个实体关系三元组依次作为当前实体关系三元组,并执行以下操作;在所述当前对象实体对应的当前图谱节点与所述候选对象实体对应的所述候选图谱节点之间尚未被添加关系连线的情况下,在所述当前图谱节点与所述候选图谱节点之间添
加所述关系连线,并在所述关系连线上标记出所述当前实体关系三元组中包含的当前关系表征文本,其中,所述当前关系表征文本用于表示所述当前对象实体与所述候选对象实体之间的当前关联关系;在所述当前对象实体对应的当前图谱节点与所述候选对象实体对应的所述候选图谱节点之间已被添加关系连线的情况下,从所述N个实体关系三元组中获取下一个实体关系三元组作为所述当前实体关系三元组。5.根据权利要求3所述的方法,其特征在于,在连接所述当前对象实体对应的图谱节点和与所述当前对象实体具有所述关联关系的候选对象实体对应的候选图谱节点时,还包括:确定所述当前对象实体与所述候选对象之间的关系指向;在关系连线上标记出与所述关系指向相匹配的指向箭头。6.根据权利要求2所述的方法,其特征在于,在所述获取任务提示信息之前,还包括:获取用于训练所述自然语言处理模型的训练文本语料,其中,所述训练文本语料包括所述任务文本语料以及领域文本语...
【专利技术属性】
技术研发人员:张子恒,林镇溪,吴贤,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。