关系三元组生成方法、装置、电子装置和存储介质制造方法及图纸

技术编号:33377582 阅读:8 留言:0更新日期:2022-05-11 22:45
本申请涉及一种关系三元组生成方法、装置、电子装置和存储介质,其中,该关系三元组生成方法包括:通过获取待检索信息的组合要素,基于知识图谱的schema信息,对组合要素进行组合,生成候选三元组,利用预设的三元组分类模型,对候选三元组进行分类,得到候选三元组的分类结果,基于分类结果,利用预设的聚合方法对候选三元组进行聚合,生成目标关系三元组。其通过知识图谱的schema信息生成候选三元组,并基于通用的分类算法框架进一步实现了候选三元组的分类,进而提高了三元组生成方法在不同复杂检索场景下的扩展性和灵活性,进而提高了对复杂检索场景的适用性。了对复杂检索场景的适用性。了对复杂检索场景的适用性。

【技术实现步骤摘要】
关系三元组生成方法、装置、电子装置和存储介质


[0001]本申请涉及信息处理领域,特别是涉及关系三元组生成方法、装置、电子装置和存储介质。

技术介绍

[0002]在基于知识图谱进行信息检索的过程中,可以通过对检索语句生成三元组,根据三元组生成图数据查询语句实现信息检索。因此,三元组的生成对检索结果的准确性有着重要影响。目前,对于复杂检索场景,往往是利用针对检索场景预先设计的模板进行三元组生成。该种方式对不同的检索场景的可扩展性较差,并且规则方法过于简单,因此对复杂检索场景的适用性较低。
[0003]针对相关技术中存在目前的三元组生成方法对复杂检索场景的适用性较低的问题,目前还没有提出有效的解决方案。

技术实现思路

[0004]在本实施例中提供了一种关系三元组生成方法、装置、电子装置和存储介质,以解决相关技术中三元组生成方法对复杂检索场景的适用性较低的问题。
[0005]第一个方面,在本实施例中提供了一种关系三元组生成方法,包括:
[0006]获取待检索信息的组合要素;
[0007]基于知识图谱的schema信息,对所述组合要素进行组合,生成候选三元组;
[0008]利用预设的三元组分类模型,对所述候选三元组进行分类,得到所述候选三元组的分类结果;
[0009]基于所述分类结果,利用预设的聚合方法对所述候选三元组进行聚合,生成目标关系三元组。
[0010]在其中的一些实施例中,所述组合要素包含所述待检索信息中的实体信息和关系信息,所述获取待检索信息的组合要素,包括:
[0011]获取所述待检索信息;
[0012]对所述待检索信息进行信息抽取处理,提取所述待检索信息包含的实体信息和关系信息,得到所述组合要素。
[0013]在其中的一些实施例中,所述三元组分类模型包括语义模型,所述利用预设的三元组分类模型,对所述候选三元组进行分类,得到所述候选三元组的分类结果,包括:
[0014]对所述候选三元组与所述待检索信息进行融合,得到待分类数据;
[0015]将所述待分类数据输入预设的语义模型进行处理,得到所述待分类数据的语义特征信息;
[0016]对所述语义特征信息进行线性映射和二分类处理,得到所述候选三元组的分类结果。
[0017]在其中的一些实施例中,所述语义模型包括词向量模型和自然语言深度学习模
型,所述将所述待分类数据输入预设的语义模型进行处理,得到所述待分类数据的语义特征信息,包括:
[0018]利用预设的词向量模型,对所述待分类数据进行编码,得到所述待分类数据的嵌入表示;
[0019]将所述嵌入表示输入预设的自然语言深度学习模型进行处理,得到所述待分类数据的语义特征信息。
[0020]在其中的一些实施例中,所述基于所述分类结果,利用预设的聚合方法对所述候选三元组进行聚合,生成目标关系三元组,包括:
[0021]基于所述分类结果,选取分类结果为正确的候选三元组,按照预设的分组规则进行分组,得到所述候选三元组的分组结果;
[0022]根据预设的合并规则对所述分组结果进行合并,生成目标关系三元组。
[0023]在其中的一些实施例中,在根据预设的合并规则对所述分组结果进行处理,生成目标关系三元组之前,所述方法还包括:
[0024]基于所述分类结果,对所述分组结果进行验证,并根据验证结果更新所述分组结果。
[0025]第二个方面,在本实施例中提供了一种关系三元组生成装置,包括:获取模块、第一生成模块、分类模块、以及第二生成模块;其中:
[0026]所述获取模块,用于获取待检索信息的组合要素;
[0027]所述第一生成模块,用于基于知识图谱的schema信息,对所述组合要素进行组合,生成候选三元组;
[0028]所述分类模块,用于利用预设的三元组分类模型,对所述候选三元组进行分类,得到所述候选三元组的分类结果;
[0029]所述第二生成模块,用于基于所述分类结果,利用预设的聚合方法对所述候选三元组进行聚合,生成目标关系三元组。
[0030]第三个方面,在本实施例中提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述的关系三元组生成方法。
[0031]第四个方面,在本实施例中提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述的关系三元组生成方法的步骤。
[0032]第五个方面,在本实施例中提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一个方面所述的关系三元组生成方法。
[0033]与相关技术相比,在本实施例中提供的关系三元组生成方法、装置、电子装置和存储介质,通过获取待检索信息的组合要素,基于知识图谱的schema信息,对组合要素进行组合,生成候选三元组,利用预设的三元组分类模型,对候选三元组进行分类,得到候选三元组的分类结果,基于分类结果,利用预设的聚合方法对候选三元组进行聚合,生成目标关系三元组。其通过知识图谱的schema信息生成候选三元组,并基于通用的分类算法框架进一步实现了对候选三元组的分类,进而提高了三元组生成方法在不同复杂检索场景下的扩展性和灵活性,进而提高了对复杂检索场景的适用性。
[0034]本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
[0035]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0036]图1是相关技术的关系三元组生成方法的终端的硬件结构框图;
[0037]图2是本实施例的关系三元组生成方法的流程图;
[0038]图3是本优选实施例的基于知识图谱的关系三元组分类方法的流程图;
[0039]图4是本优选实施例的基于知识图谱的关系三元组聚合方法的流程图;
[0040]图5是本实施例的关系三元组生成装置的结构框图;
[0041]图6是本实施例的计算机设备的结构示意图。
具体实施方式
[0042]为更清楚地理解本申请的目的、技术方案和优点,下面结合附图和实施例,对本申请进行了描述和说明。
[0043]除另作定义外,本申请所涉及的技术术语或者科学术语应具有本申请所属
具备一般技能的人所理解的一般含义。在本申请中的“一”、“一个”、“一种”、“该”、“这些”等类似的词并不表示数量上的限制,它们可以是单数或者复数。在本申请中所涉及的术语“包括”、“包含”、“具有”及其任何变体,其目的是涵盖不排他的包含;例如,包含一系列步骤或模块(单元)的过程、方法和系统、产品或设备并未限定于列出的步骤或模块(单元),而可包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关系三元组生成方法,其特征在于,包括:获取待检索信息的组合要素;基于知识图谱的schema信息,对所述组合要素进行组合,生成候选三元组;利用预设的三元组分类模型,对所述候选三元组进行分类,得到所述候选三元组的分类结果;基于所述分类结果,利用预设的聚合方法对所述候选三元组进行聚合,生成目标关系三元组。2.根据权利要求1所述的关系三元组生成方法,其特征在于,所述组合要素包含所述待检索信息中的实体信息和关系信息,所述获取待检索信息的组合要素,包括:获取所述待检索信息;对所述待检索信息进行信息抽取处理,提取所述待检索信息包含的实体信息和关系信息,得到所述组合要素。3.根据权利要求1所述的关系三元组生成方法,其特征在于,所述三元组分类模型包括语义模型,所述利用预设的三元组分类模型,对所述候选三元组进行分类,得到所述候选三元组的分类结果,包括:对所述候选三元组与所述待检索信息进行融合,得到待分类数据;将所述待分类数据输入预设的语义模型进行处理,得到所述待分类数据的语义特征信息;对所述语义特征信息进行线性映射和二分类处理,得到所述候选三元组的分类结果。4.根据权利要求3所述的关系三元组生成方法,其特征在于,所述语义模型包括词向量模型和自然语言深度学习模型,所述将所述待分类数据输入预设的语义模型进行处理,得到所述待分类数据的语义特征信息,包括:利用预设的词向量模型,对所述待分类数据进行编码,得到所述待分类数据的嵌入表示;将所述嵌入表示输入预设的自然语言深度学习模型进行处理,得到所述待分类数据的语义特征信息。5.根据权利要求1所述的关系三元组生成方法,其特征在于,所述基于所述分类结果,利用预设的聚合方法...

【专利技术属性】
技术研发人员:范鹏召刘伟棠陈立力周明伟钱佳佳郑燕玲
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1