知识图谱自动纠错方法、控制装置、设备和存储介质制造方法及图纸

技术编号:38222549 阅读:8 留言:0更新日期:2023-07-25 17:54
本发明专利技术提供一种知识图谱自动纠错方法、控制装置、设备和存储介质,涉及人工智能技术领域。一种知识图谱自动纠错方法,根据园区知识图谱生成园区整体超图和各企业的企业局部超图,根据园区知识图谱三元组构建负例并获取其初始向量表示,在根据超图获取对应的全局嵌入表示,根据初始向量表示计算KG嵌入损失,根据全局嵌入表示计算超图损失,最后结合KG嵌入损失和超图损失获取三元组的联合置信度评分并进行图谱纠错。通过该方法,根据对比学习数据构建超图损失函数,结合超图损失和KG嵌入损失获取三元组的联合置信度评分,从整体与局部的角度构造对比学习数据,从而保持整体与局部的高度一致性,提高其在实际生产环境中的纠错效果。果。果。

【技术实现步骤摘要】
知识图谱自动纠错方法、控制装置、设备和存储介质


[0001]本申请涉及人工智能
,尤其涉及一种知识图谱自动纠错方法、控制装置、设备和存储介质。

技术介绍

[0002]在卡奥斯赋能的化工园区项目中,由于化工园区中企业多,物料种类繁多,关系错综复杂等,在构建图谱过程中发现,极容易出现错误节点等噪声问题,会导致严重影响图谱产业链查询、推理分析的准确性和有效性。
[0003]目前,对于知识图谱的纠错研究主要集中在基于规则方法或者基于知识图谱嵌入损失的方法进行纠错。
[0004]传统的基于规则方法的图谱纠错,需要大量人工的工作,并且构建专业领域规则还需领域专家,这种方法的成本比较高,且规则库维护和运营也需要耗费不少精力。
[0005]传统的基于知识图谱嵌入的方法虽然减少了对人工和领域专家的依赖,但是其在训练时所需的负样本,一般由随机简单替换三元组中的头部或者尾部实体生成,这种简单负采样策略无法适应复杂的实际场景,导致在实际生产环境中纠错的效果不佳。

技术实现思路

[0006]本申请提供一种知识图谱自动纠错方法、控制装置、设备和存储介质,用以解决传统的基于知识图谱嵌入的方法无法适应复杂实际场景,导致在实际生产环境中纠错的效果不佳的问题。
[0007]第一方面,本申请提供一种知识图谱自动纠错方法,包括:
[0008]根据园区知识图谱G生成园区整体超图,以及根据所述园区内各个企业的企业知识图谱g,生成每个企业对应的企业局部超图;
[0009]构造所述园区知识图谱G的三元组(h,r,t)的目标负例,利用所述目标负例获得所述三元组的初始向量表示(H,R,T);
[0010]根据所述园区整体超图获取园区超图节点的全局嵌入表示X
i
,以及根据所述企业局部超图获取企业超图节点的全局嵌入表示Y
i

[0011]根据所述初始向量表示(H,R,T)得到KG嵌入损失,根据所述全局嵌入表示X
i
Y
i
获取超图损失;
[0012]根据所述KG嵌入损失和所述超图损失获取所述三元组(h,r,t)的联合置信度评分,并根据所述联合置信度评分进行图谱自动纠。
[0013]在一种可能的实施方式中,所述构造所述园区知识图谱G的三元组(h,r,t)的目标负例,包括:
[0014]对所述三元组(h,r,t)中的实体进行替换处理,得到所述三元组(h,r,t)的候选负例;
[0015]通过Word2Vec模型训练得到企业节点词向量表示x
i
和与物料节点词向量表示y
i
[0016]获取园区知识图谱中的企业节点在向量空间中的平均嵌入表示:
[0017]获取园区知识图谱中的物料节点在向量空间的平均嵌入表示:
[0018]当满足条件和满足条件时,将所述候选负例作为所述目标负例。
[0019]其中n:园区知识图谱中企业节点个数,m:园区知识图谱中物料节点个数,β1:第一阀值;β2:第二阀值,a
i
:园区知识图谱中企业节点的替换节点的词向量表示,b
i
:园区知识图谱中物料节点的替换节点的词向量表示。
[0020]在一种可能的实施方式中,所述利用所述目标负例获得所述三元组的初始向量表示(H,R,T),包括:
[0021]将所述目标负例三元组的关系和对应的原始三元组中的关系初始化为符合正态分布的随机向量
[0022]将所述目标负例三元组的头实体和对应的原始三元组中的头实体初始化为符合正态分布的随机向量
[0023]将所述目标负例三元组的尾实体和对应的原始三元组中的尾实体初始化为符合正态分布的随机向量
[0024]通过Bi

LSTM模型训练得到所述三元组的初始向量表示(H,R,T)。
[0025]在一种可能的实施方式中,所述根据所述园区整体超图获取园区超图节点的全局嵌入表示X
i
,包括:
[0026]拼接所述初始向量表示(H,R,T),获取所述园区整体超图的节点嵌入q
i
:q
i
=(H
i
;R
i
;T
i
);
[0027]获取q
i
与相邻的k个节点中每个节点q
j
的第一相关性分数:α
ij
=q
i
*q
j
,其中,j=1...k,K为正整数;
[0028]根据所述与第三阀值μ,得到其中,所述
[0029]根据所述和所述q
i
,通过sigmoid函数获取所述园区超图节点的全局嵌入表示X
i
:其中,σ∈(0,1);
[0030]所述根据所述企业局部超图获取企业超图节点的全局嵌入表示Y
i
,包括:
[0031]初始化所述企业局部超图节点嵌入p
i

[0032]获取p
i
与相邻的k个节点中每个节点p
j
的第二相关性分数:β
ij
=p
i
*p
j
,其中,j=1...k,K为正整数;
[0033]对所述第二相关性分数进行归一化处理,得到归一化处理后的第二相关性系数
[0034]根据所述与所述第三阀值μ,得到其中,所述
[0035]根据所述和所述p
j
,通过sigmoid函数获取所述企业超图节点的全局嵌入表示Y
i

[0036]在一种可能的实施方式中,所述根据所述全局嵌入表示X
i
Y
i
获取超图损失,包括:
[0037]获取所述X
i
与所述Y
i
的第三相关性分数cos(X
i
,Y
i
);
[0038]获取所述园区整体超图与每个所述企业局部超图的损失函数:
[0039][0040]获取所述园区整体超图与所有所述企业局部超图的损失函数:
[0041][0042]其中,c:企业局部超图中节点数量,d:园区企业数量,τ:超参数,用于控制损失函数对正负例敏感性。
[0043]在一种可能的实施方式中,所述根据所述初始向量表示(H,R,T)得到KG嵌入损失,包括:
[0044]基于TransD模型训练初始向量表示(H,R,T),得到评分函数定义为:
[0045][0046]其中,M
RH
=R
p
H
pT
+I为头实体投影到关系空间的投影矩阵,M
RT
=R
p
T
pT
+I为尾实体投影到关系空间的投影矩阵,I为单位矩阵,R
p
、H
p...

【技术保护点】

【技术特征摘要】
1.一种知识图谱自动纠错方法,其特征在于,包括:根据园区知识图谱G生成园区整体超图,以及根据所述园区内各个企业的企业知识图谱g,生成每个企业对应的企业局部超图;构造所述园区知识图谱G的三元组(h,r,t)的目标负例,利用所述目标负例获得所述三元组的初始向量表示(H,R,T);根据所述园区整体超图获取园区超图节点的全局嵌入表示X
i
,以及根据所述企业局部超图获取企业超图节点的全局嵌入表示Y
i
;根据所述初始向量表示(H,R,T)得到KG嵌入损失,根据所述全局嵌入表示X
i Y
i
获取超图损失;根据所述KG嵌入损失和所述超图损失获取所述三元组(h,r,t)的联合置信度评分,并根据所述联合置信度评分进行图谱自动纠错。2.根据权利要求1所述的方法,其特征在于,所述构造所述园区知识图谱G的三元组(h,r,t)的目标负例,包括:对所述三元组(h,r,t)中的实体进行替换处理,得到所述三元组(h,r,t)的候选负例;通过Word2Vec模型训练得到企业节点词向量表示x
i
和与物料节点词向量表示y
i
;获取园区知识图谱中的企业节点在向量空间中的平均嵌入表示:获取园区知识图谱中的物料节点在向量空间的平均嵌入表示:当满足条件和满足条件时,将所述候选负例作为所述目标负例;其中n:园区知识图谱中企业节点个数,m:园区知识图谱中物料节点个数,β1:第一阀值;β2:第二阀值,a
i
:园区知识图谱中企业节点的替换节点的词向量表示,b
i
:园区知识图谱中物料节点的替换节点的词向量表示。3.根据权利要求1所述的方法,其特征在于,所述利用所述目标负例获得所述三元组的初始向量表示(H,R,T),包括:将所述目标负例三元组的关系和对应的原始三元组中的关系初始化为符合正态分布的随机向量将所述目标负例三元组的头实体和对应的原始三元组中的头实体初始化为符合正态分布的随机向量将所述目标负例三元组的尾实体和对应的原始三元组中的尾实体初始化为符合正态分布的随机向量通过Bi

LSTM模型训练得到所述三元组的初始向量表示(H,R,T)。4.根据权利要求1所述的方法,其特征在于,所述根据所述园区整体超图获取园区超图节点的全局嵌入表示X
i
,包括:拼接所述初始向量表示(H,R,T),获取所述园区整体超图的节点嵌入q
i
:q
i
=(H
i
;R
i

T
i
);获取q
i
与相邻的k个节点中每个节点q
j
的第一相关性分数:α
ij
=q
i
*q
j
,其中,j=1...k,K为正整数;对所述第一相关性分数进行归一化处理,得到归一化处理后的第一相关性系数根据所述与第三阀值μ,得到其中,所述根据所述和所述q
i
,通过sigmoid函数获取所述园区超图节点的全局嵌入表示X
i
:其中,所述根据所述企业局部超图获取企业超图节点的全局嵌入表示Y
i
,包括:初始化所述企业局部超图节点嵌入p
i
;获取p

【专利技术属性】
技术研发人员:段玉涛王晓利郭徽孟祥秀
申请(专利权)人:卡奥斯物联科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1