System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 知识图谱生成方法、装置、设备、存储介质及程序产品制造方法及图纸_技高网

知识图谱生成方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:41242644 阅读:3 留言:0更新日期:2024-05-09 23:54
本申请提供一种知识图谱生成方法、装置、设备、存储介质及程序产品,涉及大数据技术领域。该方法包括:接收控制终端发送的图像生成指令;获取所述图像生成指令对应的三元组数据集;将所述三元组数据集输入图谱生成模型,得到所述图谱生成模型输出的知识图谱,其中所述图谱生成模型是采用补全图谱训练得到的。本申请的方法,解决了当前知识图谱的绘制方法准确度较低、缺乏全面性的问题。

【技术实现步骤摘要】

本申请涉及大数据,尤其涉及一种知识图谱生成方法、装置、设备、存储介质及程序产品


技术介绍

1、当前互联网信息的爆炸式增长,其具有大规模、多元化、组织结构松散等特点,导致人们有效获取信息和知识面临巨大挑战。在此背景下,知识图谱作为一种新颖的管理海量信息的方式,逐渐受到各大互联网企业和其他领域的青睐,并被广泛应用于搜索、电商、社交等领域。

2、目前,现有技术中通常采用transe(translating embeddings,翻译嵌入)模型进行知识图谱的绘制。

3、但是,专利技术人发现现有技术至少存在如下技术问题:当前知识图谱的绘制方法准确度较低。


技术实现思路

1、本申请提供一种知识图谱生成方法、装置、设备、存储介质及程序产品,用以解决当前知识图谱的绘制方法准确度较低的技术问题。

2、第一方面,本申请提供一种图谱生成方法,包括:接收控制终端发送的图像生成指令;获取图像生成指令对应的三元组数据集;将三元组数据集输入图谱生成模型,得到图谱生成模型输出的知识图谱,其中图谱生成模型是采用补全图谱训练得到的。

3、在一种可能的实现方式中,采用补全图谱训练的过程,包括:获取训练三元组数据集,其中训练三元组数据集包括至少一个三元组数据,三元组数据包括头实体向量、关系向量及尾实体向量;将三元组数据输入路径推理模型,得到目标头实体向量至目标尾实体向量的各路径向量,及各路径向量对应的置信度;若任一路径向量对应的置信度大于预设的置信度阈值,则将任一路径向量确定为候选向量;计算候选向量的和,得到目标路径向量;根据目标头实体向量、目标尾实体向量及目标路径向量,计算第一分数;采用三元组数据集,确定目标头实体向量及目标尾实体向量对应的第二分数;将第一分数及第二分数相加,得到总分数;若总分数大于预设的分数阈值,则将目标头实体向量及目标尾实体向量对应的三元组数据确定为训练三元组;采用三元组数据集,创建负例三元组;采用至少一个训练三元组及负例三元组进行模型训练,得到图谱生成模型。

4、在一种可能的实现方式中,采用三元组数据集,确定目标头实体向量及目标尾实体向量对应的第二分数,包括:将三元组数据集中所有关系向量聚类,得到至少一个关系簇,其中关系簇对应至少一个关系向量;计算关系簇对应的关系簇向量;计算三元组数据集中三元组数据对应的子关系向量;将子关系向量聚类,得到至少一个子关系簇;计算子关系簇对应的子关系簇向量;根据目标关系向量、关系簇向量及子关系簇向量,确定综合关系向量,其中目标关系向量为目标头实体向量及目标尾实体向量对应的关系向量;根据目标头实体向量、综合关系向量及目标尾实体向量,确定第二分数。

5、在一种可能的实现方式中,根据目标关系向量、关系簇向量及子关系簇向量,确定综合关系向量,包括:根据目标关系向量、关系簇向量及子关系簇向量,确定目标关系向量对应的目标关系簇向量及目标子关系簇向量,其中目标关系向量为目标头实体向量及目标尾实体向量对应的关系向量;将目标关系向量、目标关系簇向量及目标子关系簇向量相加,得到综合关系向量。

6、在一种可能的实现方式中,根据目标关系向量、关系簇向量及子关系簇向量,确定目标关系向量对应的目标关系簇向量及目标子关系簇向量,包括:计算目标关系向量与各关系簇向量的第一距离;将对应第一距离最小的关系簇向量确定为目标关系簇向量;计算目标关系向量与各子关系簇向量的第二距离;将对应第二距离最小的子关系簇向量确定为目标子关系簇向量。

7、在一种可能的实现方式中,计算关系簇对应的关系簇向量,包括:计算关系簇对应的关系向量的平均值,得到关系簇向量。

8、第二方面,本申请提供一种图谱生成装置,包括:接收模块,用于接收控制终端发送的图像生成指令;获取模块,用于获取图像生成指令对应的三元组数据集;生成模块,用于将三元组数据集输入图谱生成模型,得到图谱生成模型输出的知识图谱,其中图谱生成模型是采用补全图谱训练得到的。

9、第三方面,本申请提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;存储器存储计算机执行指令;处理器执行存储器存储的计算机执行指令,以实现如第一方面描述的方法。

10、第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面描述的方法。

11、第五方面,本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面描述的方法。

12、本申请提供的知识图谱生成方法、装置、设备、存储介质及程序产品,通过在接收控制终端发送的图像生成指令后,获取图像生成指令对应的三元组数据集,并采用补全图谱训练得到的图谱生成模型根据三元组数据集生成知识图谱,由于采用了补全图谱训练得到的图谱生成模型,实现了增加生成的图谱的准确性、完整性的效果。

本文档来自技高网...

【技术保护点】

1.一种图谱生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述采用补全图谱训练的过程,包括:

3.根据权利要求2所述的方法,其特征在于,所述采用所述三元组数据集,确定所述目标头实体向量及所述目标尾实体向量对应的第二分数,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据目标关系向量、所述关系簇向量及所述子关系簇向量,确定综合关系向量,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述目标关系向量、所述关系簇向量及子关系簇向量,确定目标关系向量对应的目标关系簇向量及目标子关系簇向量,包括:

6.根据权利要求3所述的方法,其特征在于,所述计算所述关系簇对应的关系簇向量,包括:

7.一种图谱生成装置,其特征在于,包括:

8.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至6中任一项所述的方法。

10.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法。

...

【技术特征摘要】

1.一种图谱生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述采用补全图谱训练的过程,包括:

3.根据权利要求2所述的方法,其特征在于,所述采用所述三元组数据集,确定所述目标头实体向量及所述目标尾实体向量对应的第二分数,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据目标关系向量、所述关系簇向量及所述子关系簇向量,确定综合关系向量,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述目标关系向量、所述关系簇向量及子关系簇向量,确定目标关系向量对应的目标关系簇向量及目标子关...

【专利技术属性】
技术研发人员:许猛陈永录张飞燕
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1