当前位置: 首页 > 专利查询>东北大学专利>正文

基于复杂网络的工业大数据的社团划分及向量表征方法技术

技术编号:32548432 阅读:18 留言:0更新日期:2022-03-05 11:47
本发明专利技术公开一种基于复杂网络的工业大数据的社团划分及向量表征方法,方法首先初始化工业制造大数据的知识图谱,然后计算新节点与初始化知识图谱中的任意节点的链接概率,最后选择链接概率最大的前s个节点作为目标节点与新节点建立链,从而完成对新节点的社团划分。此外,采用上述社团划分方法进行工业大数据的向量表征,首先找出工业制造大数据的知识图谱社团网络中所有社团的簇首节点,并计算任意节点到其所在的社团中簇首节点的路径长度,然后对簇首节点进行向量表征,最后聚合簇首节点的向量表征和任意节点的向量表征,生成聚合后的任意节点的向量表征。本发明专利技术有效的解决了工业大数据知识图谱顶层应用的可扩展性和实时性差的问题。差的问题。差的问题。

【技术实现步骤摘要】
基于复杂网络的工业大数据的社团划分及向量表征方法


[0001]本专利技术涉及工业互联网数据分析
,尤其涉及一种基于复杂网络的工业大数据的社团划分及向量表征方法。

技术介绍

[0002]在工业4.0时代背景下,工业互联网相关技术快速发展,以设备密集型、设备中心型工业企业纷纷启动智能化、智慧化转型项目,基于传感器技术、物联网传输技术、大数据计算等技术,实现工业设备的连接、监控,数字孪生的构建,预测性维护、生产效率优化、安全保障、生产优化等一系列智慧化应用的落地,并产生价值。
[0003]工业大数据分析和建模并构建智慧化应用的前题是可以采集到工业实时数据,工业传感器(温度、湿度、压力、流量、光谱、速度、震动等等)和工业控制系统(PLC/DCS)是当前工业领域数据采集的最主要手段。
[0004]工业制造大数据中蕴含了海量知识,一方面,对于制造企业实际生产流程优化和经营改善具有极大价值;另一方面,不同企业的制造大数据知识融合与汇聚,将极大的触发更深层次的数据“链式反应”,揭示企业生产、管理、经营状态和运行发展规律,对于指导企业产品优化、生产流程优化、维护过程优化、供应链优化等具有重要意义。工业制造大数据知识图谱是提升制造企业对大数据综合利用的重要手段。工业制造大数据知识汇聚、知识表征、知识融合和各类基于工业制造大数据知识图谱的顶层应用的构建存在体量大、价值密度稀疏、时序变化等难点问题。如何提升工业制造大数据知识图谱应用效率,降低计算规模、提升价值密度是一个重要的挑战问题。
[0005]知识图谱(Knowledge graph)技术是近年来兴起的热门人工智能技术,它可以被广泛地应用在知识表达、自动推理、对话生成、自动问答等人工智能系统中。表示学习(也称为表征学习,Representation learning)是将考虑的实体或关系计算出相应的向量化表示的方法,它是深度学习的最核心技术。知识图谱表征学习就是利用机器学习技术自动获取每一个实体或者关系的向量化表达。表征学习旨在将研究对象的语义信息表示为稠密低维实体向量,知识图谱表征学习主要是面对知识图谱中的实体和关系进行表征学习,使用建模方法将实体和关系在低维稠密向量空间中,然后进行计算和推理,即简单说:将三元组表示成向量的这个过程就称为表示学习。传统的知识图谱在表征学习方面,通常对整个图谱上的实体和关系进行向量化表示,其共同特点都是采用翻译的方式将实体或关系映射到低维向量空间,当知识图谱规模不大、对图谱的更新要求不高的时候,传统的方法是有效的。但是,对应工业制造大数据而言,由于各类机器数据(生产设备、传感器、各类系统)规模超量、实时性强,传统的面向全局网络的实体向量表征计算方法已经无法满足其需求。

技术实现思路

[0006]针对上述现有技术的不足,本专利技术提供一种基于复杂网络的工业大数据的社团划分及向量表征方法。
[0007]为解决上述技术问题,本专利技术所采取的技术方案是:一种基于复杂网络的工业大数据的社团划分方法,包括如下步骤:
[0008]步骤1:初始化工业制造大数据的知识图谱G=(V,E):假设初始m0个节点,并形成n0个初始默认社团{G1,G2,

,G
n0
},其中,元素V为工业制造大数据在知识图谱中的节点或顶点(Vertex或Node),元素E为知识图谱的边(Edge或Link);
[0009]步骤2:引入工业制造大数据的新节点c
p
∈{v1,v2,

,v
n
},计算c
p
与初始知识图谱G中的任意一个节点c的链接概率Π(c
p
,c),其中c∈{G1,G2,

,G
n0
};
[0010][0011]其中,f(c
p
,c)表示节点c
p
和c的嵌入向量embedding在知识图谱向量空间中的相似性,k(c)表示节点c在知识图谱网络中的拓扑重要程度,α∈[0,1]是权重条件因子。
[0012]所述权重条件因子α采用GridSearch自动调参的方法,α取值范围为{1,0.8,0.6,0.4,0.2,0.1}。
[0013]所述函数f(c
p
,c)采用向量内积的计算方法,即其中,e
c
为节点c
p
和c的向量表征。
[0014]所述知识图谱网络中的拓扑重要程度k(c)的计算方法如下:
[0015][0016]其中,edge(c,c
i
)∈{0,1},当edge(c,c
i
)=1时,节点c与c
i
有直接边关联,当edge(c,c
i
)=0时,节点c与c
i
没有直接边关联,N为知识图谱网络的总节点数。
[0017]步骤3:随机选择初始知识图谱G中与新节点c
p
链接概率最大的前s个节点作为目标节点并与新节点c
p
建立链;
[0018]步骤4:重复步骤2和步骤3直到所有的新节点全部加入社团{G1,G2,

,G
n0
},得到工业制造大数据的新的知识图谱社团集合{G1,G2,

,G
n
},n为新的知识图谱中社团的个数。
[0019]另一方面,本专利技术还提供一种采用上述基于复杂网络的工业大数据的社团划分方法对工业大数据进行向量表征的方法,包括如下步骤:
[0020]步骤1:采用基于复杂网络的工业大数据的社团划分方法对工业制造大数据的知识图谱社团进行划分,得到工业制造大数据的知识图谱社团网络{G1,G2,

,Gn};
[0021]步骤2:对于任意节点v∈V,计算v到其所在的社团G
i
中“簇首”的路径长度,过程如下:
[0022]步骤2.1:社团G
i
中的拓扑重要程度最大的节点为社团G
i
内的簇首节点,描述如下:
[0023][0024]其中,Z(.)为簇首节点c'的计算公式,q(c,G
i
)表示社团G
i
中的任意节点c与社团G
i
中的其他节点关联边数,为社团G
i
内所有节点度的平均值,σ2(G
i
)表示社团G
i
内所有节点度的方差;
[0025]步骤2.2:计算v到其所在的社团G
i
中簇首节点c'的路径长度d
vc


[0026]假设v到c'的路径集合为path={p1,p2,

,p
n
},选择v到c'的路径集合中边数最少的那条路径,用p
min
=min{path}表示;
[0027]取路径p
min
的路本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于复杂网络的工业大数据的社团划分方法,其特征在于,包括如下步骤:步骤1:初始化工业制造大数据的知识图谱G=(V,E):假设初始m0个节点,并形成n0个初始默认社团{G1,G2,

,G
n0
},其中,元素V为工业制造大数据在知识图谱中的节点或顶点,元素E为知识图谱的边;步骤2:引入工业制造大数据的新节点c
p
∈{v1,v2,

,v
n
},计算c
p
与初始知识图谱G中的任意一个节点c的链接概率Π(c
p
,c),其中c∈{G1,G2,

,G
n0
};步骤3:随机选择初始知识图谱G中与新节点c
p
链接概率最大的前s个节点作为目标节点并与新节点c
p
建立链;步骤4:重复步骤2和步骤3直到所有的新节点全部加入社团{G1,G2,

,G
n0
},得到工业制造大数据的新的知识图谱社团集合{G1,G2,

,G
n
},n为新的知识图谱中社团的个数。2.根据权利要求1所述的基于复杂网络的工业大数据的社团划分方法,其特征在于:所述步骤2的计算方法如下:其中,f(c
p
,c)表示节点c
p
和c的嵌入向量embedding在知识图谱向量空间中的相似性,k(c)表示节点c在知识图谱网络中的拓扑重要程度,α∈[0,1]是权重条件因子。3.根据权利要求2所述的基于复杂网络的工业大数据的社团划分方法,其特征在于:所述权重条件因子α采用GridSearch自动调参的方法,α取值范围为{1,0.8,0.6,0.4,0.2,0.1}。4.根据权利要求2所述的基于复杂网络的工业制造大数据的社团划分方法,其特征在于:所述函数f(c
p
,c)采用向量内积的计算方法,即其中,e
c
为节点c
p
和c的向量表征。5.根据权利要求2所述的基于复杂网络的工业大数据的社团划分方法,其特征在于:所述知识图谱网络中的拓扑重要程度k(c)的计算方法如下:其中,edge(c,c
i
)∈{0,1},当edge(c,c
i
)=1时,节点c与c
i
有直接边关联,当edge(c,c
i
)=0时,节点c与c
i
没有直接边关联,N为知识图谱网络的总节点数。6.采用权利要求1至5中任意一项所述的基于复杂网络的工业大数据的社团划分方法对工业大数据进行向量表征的方法,其特征在于,包括如下步骤:步骤1:采用基于复杂网络的工业大数据的社团划分方法对工业制造大数据的知识图谱社团进行划分,得到工业制造大...

【专利技术属性】
技术研发人员:杨晓春宋凡非徐自强王斌张晓红
申请(专利权)人:东北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1