一种基于大数据的故障溯源方法及系统技术方案

技术编号:39044714 阅读:19 留言:0更新日期:2023-10-10 11:57
本发明专利技术公开了一种基于大数据的故障溯源方法,包括基于蝙蝠算法对随机森林评分进行优化,获取数据网络节点;依据预先训练好的描述长度的数学模型,构建所述数据网络节点的有向图;基于所述数据网络节点的有向图中密度最大的所述数据网络节点作为条件概率,代入预设故障后验概率条件数据,获取故障传播路径。本申请以启发式搜索为基础,采用蝙蝠算法优化随机森林方法实现自适应数据降维,选取数据网络节点,降低数据网络复杂度。采用最短描述长度法给予评分函数训练数据网络结构,依据节俭原则实现网络复杂度和网络精度的平衡。同时利用贝叶斯全概率准则下的最大后验概率确定数据网络的网络参数,进而反向推理确定最可能的故障传播路径和故障源。传播路径和故障源。传播路径和故障源。

【技术实现步骤摘要】
一种基于大数据的故障溯源方法及系统


[0001]本专利技术涉及数据处理
,特别是涉及一种基于大数据的故障溯源方法、系统、电子设备及存储介质。

技术介绍

[0002]近年来,石化行业安全生产趋势相对稳定,但仍面临着高风险的挑战,防范化解重大安全风险任务艰巨复杂。
[0003]石化过程的各单元、装置之间紧密耦合,故障原因与故障之间具有复杂的映射关系,工艺参数关联性强。现有的故障溯源方法需要精确的数学模型和准确的先验知识。但是由于实际过程非常复杂,先验知识难以获得,无法准确地匹配过程的历史数据,因而存在较大的建模误差和较高的错误率,甚至无法在高维复杂系统中实现故障溯源。
[0004]由于存在上述技术问题,本专利技术提供一种基于大数据的故障溯源方法、系统、电子设备及存储介质。

技术实现思路

[0005]为解决现有技术中故障溯源的方法过程较复杂,无法准确地匹配过程的历史数据,存在较大的建模误差和较高的错误率,无法在高维复杂系统中实现故障溯源的技术问题,本专利技术提供一种基于大数据的故障溯源方法、系统、电子设备及存储介质。
[0006]为实现本专利技术目的提供的一种基于大数据的故障溯源方法,包括:
[0007]基于蝙蝠算法对随机森林评分进行优化,获取数据网络节点;
[0008]基于所述数据网络节点,依据预先训练好的描述长度的数学模型,构建所述数据网络节点的有向图;
[0009]基于所述数据网络节点的有向图中密度最大的所述数据网络节点作为条件概率,代入预设故障后验概率条件数据,获取故障传播路径。
[0010]在其中一些具体实施例中,基于蝙蝠算法对随机森林评分进行优化,获取数据网络节点,具体包括:
[0011]预先设置RF的初始参数、蝙蝠形式以及给定个体数和更新次数;
[0012]基于所述RF的初始参数、蝙蝠形式、给定个体数和所述更新次数,对蝙蝠的飞行速度和位置更新,得到新解;
[0013]基于最小基尼系数为适应函数,获取所述适应函数值最小的解;
[0014]基于所述新解和所述最小的解,通过全局寻优得到最优解;
[0015]基于所述最优解,构建至少一棵决策树,所述决策树根据所述最优解的限度进行生长;
[0016]基于所述各棵决策树的投票结果,获取各样本的投票分数,以获取所述各棵决策树中的误差率矩阵;
[0017]获取所述各样本节点变量的重要性评分;
[0018]基于所述各样本节点变量的重要性评分,获取所述数据网络节点。
[0019]在其中一些具体实施例中,所述RF的初始参数为,x0=(n_estimators,max_depth),所述n_estimators为树的数量,所述max_depth为树的最大深度;
[0020]所述最优解为,x
*
=(n_estimators_best,max_depth_best);
[0021]所述决策树棵树基于所述最优解中的n_estimators_best决定,所述各决策树基于所述最优解中的max_depth_best限度生长;
[0022]其中,所述x0=(n_estimators,max_depth)设置为,x0=(1,1),所述蝙蝠形式设置为均匀分布形式,所述给定个体数设置为20,所述更新次数为1000。
[0023]在其中一些具体实施例中,基于所述各棵决策树的投票结果,获取各样本的投票分数,以获取所述各棵决策树中的误差率矩阵,包括:
[0024]对所述各棵决策树进行投票,获取每个所述样本的投票分数为s
j
=[s1,s2,

,s
n

m
];
[0025]改变所述各样本节点变量的数值,获取新测试样本并对所述样本进行投票,获得第i棵树的误差率矩阵
[0026][0027]基于所述各样本节点变量的重要性评分,获取所述数据网络节点,包括:
[0028]得到节点变量x
i
的重要性评分
[0029]选取评分高的变量作为数据网络节点。
[0030]在其中一些具体实施例中,基于所述数据网络节点,依据预先训练好的描述长度的数学模型,构建所述数据网络节点的有向图,具体包括:
[0031]所述描述长度的数学模型为:
[0032][0033]其中,其中,L1为有向无环图的描述长度,L2为模型参数概率的编码长度,L3为模型对数据编码的长度,n表示节点个数,k
i
表示第i个节点的父节点数,N表示实例个数,|π
i
|表示父节点集的子集数,S
i
表示变量的取值数,H(x|y)=

∑P(x,y)log P(x|y)表示x对y的条件熵。
[0034]在其中一些具体实施例中,设定阈值ε,将获取出来的所述数据网络节点作为决策变量,计算与属性变量之间的互信息熵;
[0035]将熵小于ε的两个变量之间连接边,利用邻接矩阵,构建无向图;
[0036]对每个节点X
i
,确定其父节点集π
i
,根据互信息熵对父节点升序排列,由顶而下对模型进行最短描述长度评分搜索;
[0037]选取S
MDL
评分最小的结构,得到节点X
i
的最优子结构的父节点X
j
,赋予X
j
到X
i
的有向边,构建所述数据网络节点的有向图。
[0038]在其中一些具体实施例中,基于所述数据网络节点的有向图中密度最大的所述数
据网络节点作为条件概率,代入预设故障后验概率条件数据,获取故障传播路径,具体包括:
[0039]代入所述预设故障后验概率条件数据,当节点x状态发生变化时,父节点π的后验概率由下式确定:
[0040][0041]其中,p(x|π)表示节点x的先验概率;
[0042]基于上式,通过贝叶斯推理获取故障传播路径。
[0043]基于同一构思,本专利技术还提供一种基于大数据的故障溯源系统,包括:
[0044]数据节点获取模块,用于基于蝙蝠算法对随机森林评分进行优化,获取数据网络节点;
[0045]有向图构建模块,用于基于所述数据网络节点,依据预先训练好的描述长度的数学模型,构建所述数据网络节点的有向图;
[0046]故障路径获取模块,用于基于所述数据网络节点的有向图中密度最大的所述数据网络节点作为条件概率,代入预设故障后验概率条件数据,获取故障传播路径。
[0047]基于同一构思,本专利技术还提供一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;所述存储器中存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行上述基于大数据的故障溯源方法的步骤。
[0048]基于同一构思,本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的故障溯源方法,其特征在于,包括:基于蝙蝠算法对随机森林评分进行优化,获取数据网络节点;基于所述数据网络节点,依据预先训练好的描述长度的数学模型,构建所述数据网络节点的有向图;基于所述数据网络节点的有向图中密度最大的所述数据网络节点作为条件概率,代入预设故障后验概率条件数据,获取故障传播路径。2.根据权利要求1所述的基于大数据的故障溯源方法,其特征在于,基于蝙蝠算法对随机森林评分进行优化,获取数据网络节点,具体包括:预先设置RF的初始参数、蝙蝠形式以及给定个体数和更新次数;基于所述RF的初始参数、蝙蝠形式、给定个体数和所述更新次数,对蝙蝠的飞行速度和位置更新,得到新解;基于最小基尼系数为适应函数,获取所述适应函数值最小的解;基于所述新解和所述最小的解,通过全局寻优得到最优解;基于所述最优解,构建至少一棵决策树,所述决策树根据所述最优解的限度进行生长;基于所述各棵决策树的投票结果,获取各样本的投票分数,以获取所述各棵决策树中的误差率矩阵;获取所述各样本节点变量的重要性评分;基于所述各样本节点变量的重要性评分,获取所述数据网络节点。3.根据权利要求2所述的基于大数据的故障溯源方法,其特征在于,所述RF的初始参数为,x0=(n_estimators,max_depth),所述n_estimators为树的数量,所述max_depth为树的最大深度;所述最优解为,x
*
=(n_estimators_best,max_depth_best);所述决策树棵树基于所述最优解中的n_estimators_best决定,所述各决策树基于所述最优解中的max_depth_best限度生长;其中,所述x0=(n_estimators,max_depth)设置为,x0=(1,1),所述蝙蝠形式设置为均匀分布形式,所述给定个体数设置为20,所述更新次数为1000。4.根据权利要求3所述的基于大数据的故障溯源方法,其特征在于,基于所述各棵决策树的投票结果,获取各样本的投票分数,以获取所述各棵决策树中的误差率矩阵,包括:对所述各棵决策树进行投票,获取每个所述样本的投票分数为s
j
=s1,s2,

,s
n

m
;改变所述各样本节点变量的数值,获取新测试样本并对所述样本进行投票,获得第i棵树的误差率矩阵基于所述各样本节点变量的重要性评分,获取所述数据网络节点,包括:得到节点变量x
i
的重要性评分选取评分高的变量作为数据网络节点。5.根据权利要求1所述的基于大数据的故障溯源方法,其特征在于,基于所述数据网络
...

【专利技术属性】
技术研发人员:商国庆
申请(专利权)人:中国第一汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1