【技术实现步骤摘要】
一种基于分层跨域知识协同推演的工业知识图谱补齐方法
[0001]本专利技术属于知识图谱优化
,特别是涉及一种基于分层跨域知识协同推演的工业知识图谱补齐方法。
技术介绍
[0002]伴随着工业信息化的浪潮,私人化、个性化的订单需求成为常态,这为制造资源的智能优化调度带来了挑战。目前,制造业产生的数据呈现出爆炸式增长的态势,这些数据是多源异构、多尺度的。如何将数据转化为知识,从而实现个性化订单与制造资源之间的智能配置,是提供企业认知智能生产水平的有效策略。然而,制造过程中的数据类别是多样的,数据之间有许多规则和约束,使得数据间的关系错综复杂。如何充分整合车间资源的复杂数据,从海量制造数据中挖掘语义信息,形成可驱动下游任务的知识建模方法,是一项尚未解决的问题。
[0003]知识图谱是一种大规模语义网络知识库。作为一种典型的结构化数据表示形式,它本质上是一个由所链接的实体和实体之间的关系组成的语义网络。它采取符号化的知识表示方式,利用[头实体、关系、尾实体]三元组来描述具体的知识,并以有向图的形式对其进行表示和存储。由 ...
【技术保护点】
【技术特征摘要】
1.一种基于分层跨域知识协同推演的工业知识图谱补齐方法,其特征在于,包括步骤:S10,获取多个生产中涉及的原始知识图谱;S20,将每个原始知识图谱输入对抗性翻译网络,从中配置相应的隐私差异化生成性对抗网络;利用差异隐私抗性生成结构来对原始知识图谱统一对齐实体和关系的嵌入,并生成对齐实体和关系的聚合嵌入;S30,将获得的已对齐实体和关系的聚合嵌入,输入知识协同推演网络,获得补齐后的生产知识图谱。2.根据权利要求1所述的一种基于分层跨域知识协同推演的工业知识图谱补齐方法,其特征在于,在步骤S20中,利用对抗性训练来学习从源嵌入空间到目标嵌入空间的平移映射,将保护隐私的对抗性翻译网络构建为一个基于多种经典的生成性对抗网络的隐私差异化生成性对抗网络族。3.根据权利要求2所述的一种基于分层跨域知识协同推演的工业知识图谱补齐方法,其特征在于,所述隐私差异化生成性对抗网络族的构建过程包括步骤:S201,对于给定的一对具有对齐实体和关系的知识图谱(g
i
,g
j
),保护隐私的对抗性翻译网络利用生成性对抗网络结构来统一对齐实体和关系的嵌入;其中,生成器置于g
i
,鉴别器置于g
j
;S202,训练生成器学习从g
i
的嵌入空间到g
j
的嵌入空间的线性平移映射,将对齐实体的嵌入从g
i
转换到g
j
并生成高质量的虚拟样本,同时训练鉴别器将生成器通过映射合成的虚拟嵌入与g
j
中的真实嵌入进行正确地区分;经过这样对抗性的训练和学习,最终的合成嵌入结合来自g
i
和g
j
的特征和信息进行学习,并在g
i
和g
j
中更改对齐实体和关系的初始嵌入;S203,当上述步骤中的训练过程稳定后,g
i
中的生成器将生成与对齐的实体和关系相邻的实体和链接关系的嵌入,并将它们作为虚拟实体和关系传输给g
j
;当此联合结束,下一个新的联合尚未开始时,生成的虚拟实体和链接关系将被删除。4.根据权利要求1所述的一种基于分层跨域知识协同推演的工业知识图谱补齐方法,其特征在于,所述保护隐私的对抗性翻译网络是隐私差异化与不同的生成性对抗网络的结合,包括三种隐私差异化生成性对抗网络作为保护隐私的对抗性翻译网络的内置模型,分别为:差分隐私生成性对抗网络DP
‑
GAN,通过在生成性对抗网络结构训练过程中,将设置随机噪声添加到梯度中,从而实现隐私差异化;基于PATE机制的生成性对抗网PATE
‑
GAN,通过在教师输出中添加随机噪声,保证了具有多个教师鉴别器和一个学生鉴别器的生成性对抗网络结构中的隐私差异化;将学生鉴别器的训练样本从公共数据和未标记数据转换为噪声聚合的教师标记数据;差分隐私半监督式生成性对抗网络DP
‑
ACGAN,通过在随机梯度下降过程中引入拉普拉斯噪声来实现隐私差异化;在添加噪声之前,进行梯度剪切;梯度裁剪通过从两侧切断l2范数来限制每个循环中梯度范数的上界。5.根据权利要求4所述的一种基于分层跨域知识协同推演的工业知识图谱补齐方法,其特征在于,所述差分隐私生成性对抗网络DP
‑
GAN,结合随机噪声与权重剪裁;基于WGAN网络中的瓦瑟斯坦距离,得到了双人极大极小博弈值如下:
其中,W是平移映射关系矩阵,E[
·
]表示数学期望函数,函数f
w
为利普希茨连续,而f
w
的利普希茨连续性是通过权重剪切保证的;在双人极大极小博弈中,生成器的目标是使生成的虚拟样本和真实样本之间的瓦瑟斯坦距离最小化,生成器的损失函数为:在双人极大极小博弈中,鉴别器的目标是使生成的虚拟样本和真实样本之间的瓦瑟斯坦距离最大化,鉴别器的损失函数为:对于给定的一对具有对齐实体和关系的知识图谱(g
i
,g
j
),参数为θ的生成器位于客户端g
i
,参数为β的鉴别器位于主机g
j
;客户端g
i
生成对齐实体E
i
∩E
j
和关系R
i
∩R
j
的集成嵌入,将其发送出去并使用接收到的梯度更新模型;主机g
j
区分真实样本和生成的虚拟样本,并计算生成器损失L(G)和鉴别器损失L(D);内置差分隐私生成性对抗网络的保护隐私的对抗性翻译的训练过程如下:X表示g
i
中对齐的实体和关系的嵌入,Y表示g
j
中对齐的实体和关系的嵌入;设Pi(x)表示X表示X在g
i
的嵌入空间上的分布,P
j
(y)表示Y表示Y在g
j
的嵌入空间上的分布;然后对于每个鉴别器迭代,采样一批包括了客户端和主机的训练样本;添加噪声后对于主机数据点和客户端数据点之间的瓦瑟斯坦距离梯度进行权重剪切,使f
w
满足利普希茨连续性,然后更新生成器参数;当所有迭代结束时,得到了一个隐私差异化生成器和隐私差异化输出,用于细化g
i
和g
j
中对齐实体和关系的嵌入。6.根据权利要求4所述的一种基于分层跨域知识协同推演的工业知识图谱补齐方法,其特征在于,基于PATE机制的生成性对抗网PATE
‑
GAN中:对于一对知识图谱(g
i
,g
j
...
【专利技术属性】
技术研发人员:彭浩,高泽,王悦,刘琳,王钢,张靖仪,冼俊宇,邹东成,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。