【技术实现步骤摘要】
一种多视图对比增强的煤矿多关系大数据分析方法
[0001]本专利技术涉及大数据计算
、
多关系数据分析
,尤其涉及一种多视图对比增强的煤矿多关系大数据分析方法
。
技术介绍
[0002]多关系大数据广泛存在于实际生产生活当中
。
在不同领域中,由于场景的复杂性
、
业务的复杂性,产生的数据通常具有多种实体类型,数据间关系复杂多变,同时具有噪声大
、
冗余多
、
规模庞大等特点
。
以煤矿领域的业务场景为例,煤矿中不同工种的工人,通过不同的作业行为可能产生不同的火灾
(
或火灾隐患
)
,传统的煤矿多关系分析方法一条记录表示一种火灾
(
隐患
)
实体,难以发现多种火灾
(
隐患
)
之间的耦合关系
。
尽管有一部分研究提出了大数据分析方法,但是这些分析方法没能有效解决大数据的多关系抽取问题,如专利号为 />CN201810本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种多视图对比增强的煤矿多关系大数据分析方法,其特征在于,所述分析方法用于对煤矿复杂场景或者复杂业务下的数据关联关系进行分析;所述复杂场景或者复杂业务是指以煤矿领域为代表的应用场景或者业务中包含多种实体类型且数据间关系复杂多变
、
场景或业务中没有数据节点的领域标签作为引导信息;所述分析方法包括以下步骤:
S1
,获取煤矿复杂场景或者复杂业务下待分析的数据信息,根据该数据信息的已有观测关系构建煤矿复杂业务场景异质图模型,对数据单元和观测关系进行表示,利用异质图模型中节点特征计算节点之间的相似度,生成相似度图,用于抽取数据间的关键关联关系;
S2
,根据煤矿领域特性,对生成的相似度图依次进行稀疏化
、
非负化和归一化预处理;
S3
,通过对比学习与无监督的优化方法,对相似度图与原始图结构进行优化,通过动态融合生成能够保持原有拓扑信息的新图,减少噪声关系,并对缺失关系进行补全;
S4
,通过渐进式的图结构更新策略,减少因网络拟合能力不足所引入的误差,对抽取和表征的复杂数据间的关系进行更新
。2.
根据权利要求1所述的多视图对比增强的煤矿多关系大数据分析方法,其特征在于,步骤
S1
中,生成相似度图的过程包括以下子步骤:
S11
,将不同类型数据节点的特征映射至同一特征空间中,映射过程如下:式中,是数据节点类型特定的映射矩阵;
d
是所有类型数据节点映射后的特征维度;为经过映射后的类型为
t
的数据节点特征;
S12
,使用
L
层的多层感知器用于学习数据节点的嵌入向量,
MLP
的输入为经过映射后的数据节点特征第
l
层网络学习数据节点嵌入的过程如下:式中,是第
l
层网络的参数矩阵;
σ
()
是非线性激活函数;
S13
,对预先设定的多条元路径采用相似度计算函数分别学习出每条元路径对应的相似度图,记为具体地,针对给定元路径
P
m
,
m
=1,2,
…
,
M
,采用相似度计算函数计算得到相似度图:式中,
φ
()
为
cosine
相似度计算函数;与为元路径
P
m
的两端的数据节点所对应的特征;为元路径
P
m
开始的数据节点的类型;为元路径
P
m
结束的数据节点的类型;为生成的与元路径邻接矩阵相同维度的相似度图
。3.
根据权利要求1所述的多视图对比增强的煤矿多关系大数据分析方法,其特征在于,步骤
S2
中,采用
k
最邻近分类算法对生成的相似度图进行稀疏化处理,具体方式如下:对于每一个数据节点,只保留
k
个与该数据节点最相似的邻居,将其余的交互权重设置
为0,对于每一条元路径下的相似度图
m
=1,2,
…
,
M
,稀疏化的过程如下:式中,
top
‑
k()
是
k
最值选择函数,用于选择行向量中
k
个最大值;是相似度图邻接矩阵的第
i
行;
f
sp
()
表示稀疏化函数;经过稀疏化操作后,获得只保留了
k
个最相似邻居的相似度图结构个最相似邻居的相似度图结构
4.
根据权利要求1所述的多视图对比增强的煤矿多关系大数据分析方法,其特征在于,步骤
S2
中,通过
ReLU
激活函数将相似度图的边权重非负化,对于每一条元路径下的相似度图
m
=1,2,
…
,
M
,非负化的过程如下:式中,
f
act
()
表示非负化函数;
σ
()
为非线性激活函数;经过非负化操作后,得到经过稀疏化与非负化的相似度图经过非负化操作后,得到经过稀疏化与非负化的相似度图
5.
根据权利要求1所述的多视图对比增强的煤矿多关系大数据分析方法,其特征在于,骤
S2
中,对每一条元路径下的相似度图
m
=1,2,
…
,
M
执行归一化操作,使相似度图中的边权重取值放置在
[0
,
1]
范围内,归一化的计算过程如下:式中,为相似度图的节点度矩阵,其形式为对角矩阵,对角线元素为对应节点的度;输出的为相似度图的归一化拉普拉斯矩阵
。6.
根据权利要求1所述的多视图对比增强的煤矿多关系大数据分析方法,其特征在于,步骤
S3
中,通过对比学习与无监督的优化方法,对相似度图与原始图结构进行优化,通过动态融合生成能够保持原有业务拓扑关系的新图,减少噪声关系,并对缺失关系进行补全的过程包括以下步骤:
S31
,设置对比学习视图;对比学习视图包括学习视图和固定...
【专利技术属性】
技术研发人员:李亚,孟庆勇,王冀宁,袁冠,王思阳,邴睿,李丹妮,
申请(专利权)人:中国矿业大学徐州中矿华信科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。