一种面向工业互联网多平台的知识图谱实体对齐方法技术

技术编号:41006250 阅读:23 留言:0更新日期:2024-04-18 21:42
本发明专利技术公开了一种面向工业互联网多平台的知识图谱实体对齐方法,分为如下的主要四个流程:首先,考虑到企业数据的隐私性,企业的数据信息在本地存储。企业在本地构建基于知识图注意力网络(KGAT)的实体对齐模型,并根据本地数据进行训练;其次,将KGAT模型梯度参数上传行业级工业互联网平台服务中心;再次,服务中心聚合出全局最优的KGAT模型参数;最后,服务中心将KGAT模型参数下发到企业进行参数更新。本专利为工业互联网多平台知识图谱构建工作,实现知识图谱的“共建共享”,提供了一种有潜力的解决方案。

【技术实现步骤摘要】

本专利技术属于工业互联网、联邦学习和实体对齐领域,尤其涉及一种面向工业互联网多平台的知识图谱实体对齐方法


技术介绍

1、工业互联网的第一性原理,即联接一切可以联接的工业要素和生态要素。知识图谱技术可以以可视化的形式,展示各类实体之间的潜在关系,助力了工业互联网的联接从“看得见,摸得着,弄得明白”的工业要素迈向“看不见,摸不着,弄不明白”的工业要素。搭建知识图谱,已经成为了企业数字化转型,工业互联网建设的基本共识。

2、自工业和信息化部出台《工业互联网平台建设与推广指南》以来,“1+n+x”的工业互联网平台结构,即“1”个国家级工业互联网区域通用平台,“n”个行业级工业互联网平台,“x”为企业级工业互联网平台,已经成为了我国工业互联网平台的结构范式。在这样的背景下,我们已经从知识图谱的“自建自用”的阶段,迈向了“共建共享”的新阶段。“共建共享”即意味着各单位工业知识图谱之间可以以一定的方式互通有无,充分利用企业知识之间的“相似性”和“互补性”。例如,在石油工业中,产业链长,涉及研、产、运、炼、销等环节,各环节之间信息相对孤立,数据离散。各环节的本文档来自技高网...

【技术保护点】

1.一种面向工业互联网多平台的知识图谱实体对齐方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种面向工业互联网多平台的知识图谱实体对齐方法,其特征在于,步骤1具体包括如下步骤:

3.根据权利要求2所述的一种面向工业互联网多平台的知识图谱实体对齐方法,其特征在于,步骤1.1具体为:定义工业领域知识图谱表达式为G=(E,R,A,TR,TA),其中E为实体集合,R为关系集合,A为数值属性集合,TA=E×A表示实体属性集合,TR=E×R×E为关系三元组集合,其中每一个关系三元组表示为(h,r,t),r是头部实体h和尾部实体t之间的关系,实体对齐工作即为寻找两个...

【技术特征摘要】

1.一种面向工业互联网多平台的知识图谱实体对齐方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种面向工业互联网多平台的知识图谱实体对齐方法,其特征在于,步骤1具体包括如下步骤:

3.根据权利要求2所述的一种面向工业互联网多平台的知识图谱实体对齐方法,其特征在于,步骤1.1具体为:定义工业领域知识图谱表达式为g=(e,r,a,tr,ta),其中e为实体集合,r为关系集合,a为数值属性集合,ta=e×a表示实体属性集合,tr=e×r×e为关系三元组集合,其中每一个关系三元组表示为(h,r,t),r是头部实体h和尾部实体t之间的关系,实体对齐工作即为寻找两个知识图谱g1=(e1,r1,a1,t1r,t1a)和g2=(e2,r2,a2,t2r,t2a)之间的所有在现实世界中表示同一物体或概念的等价实体,构建等价实体集合c={(ei,ej)||ei≡ej,ei∈e1,ej∈e2},企业于本地构建基于知识图注意力网络kgat的实体对齐模型,其为半监督学习模型,根据本地已定义的等价实体对s={(ei,ej)|ei∈e1,ej∈e2}数据进行训练。

4.根据权利要求2所述的一种面向工业互联网多平台的知识图谱实体对齐方法,其特征在于,步骤1.2具体为:在实体对齐kgat模型中,为了显示实体及关系表示的相关性,第l层中尾部实体与其相应的头部实体之间的注意力权重表示为:

5.根据权利要求2所述一种...

【专利技术属性】
技术研发人员:赵海涛荀位孙金龙陈科齐倪艺洋徐邦宁
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1