【技术实现步骤摘要】
一种基于大数据的故障溯源方法及系统
[0001]本专利技术涉及数据处理
,特别是涉及一种基于大数据的故障溯源方法、系统、电子设备及存储介质。
技术介绍
[0002]近年来,石化行业安全生产趋势相对稳定,但仍面临着高风险的挑战,防范化解重大安全风险任务艰巨复杂。
[0003]石化过程的各单元、装置之间紧密耦合,故障原因与故障之间具有复杂的映射关系,工艺参数关联性强。现有的故障溯源方法需要精确的数学模型和准确的先验知识。但是由于实际过程非常复杂,先验知识难以获得,无法准确地匹配过程的历史数据,因而存在较大的建模误差和较高的错误率,甚至无法在高维复杂系统中实现故障溯源。
[0004]由于存在上述技术问题,本专利技术提供一种基于大数据的故障溯源方法、系统、电子设备及存储介质。
技术实现思路
[0005]为解决现有技术中故障溯源的方法过程较复杂,无法准确地匹配过程的历史数据,存在较大的建模误差和较高的错误率,无法在高维复杂系统中实现故障溯源的技术问题,本专利技术提供一种基于大数据的故障溯源方法、系统、电子设备及存储介质。
[0006]为实现本专利技术目的提供的一种基于大数据的故障溯源方法,包括:
[0007]基于蝙蝠算法对随机森林评分进行优化,获取数据网络节点;
[0008]基于所述数据网络节点,依据预先训练好的描述长度的数学模型,构建所述数据网络节点的有向图;
[0009]基于所述数据网络节点的有向图中密度最大的所述数据网络节点作为条件概率,代入预设故障后 ...
【技术保护点】
【技术特征摘要】
1.一种基于大数据的故障溯源方法,其特征在于,包括:基于蝙蝠算法对随机森林评分进行优化,获取数据网络节点;基于所述数据网络节点,依据预先训练好的描述长度的数学模型,构建所述数据网络节点的有向图;基于所述数据网络节点的有向图中密度最大的所述数据网络节点作为条件概率,代入预设故障后验概率条件数据,获取故障传播路径。2.根据权利要求1所述的基于大数据的故障溯源方法,其特征在于,基于蝙蝠算法对随机森林评分进行优化,获取数据网络节点,具体包括:预先设置RF的初始参数、蝙蝠形式以及给定个体数和更新次数;基于所述RF的初始参数、蝙蝠形式、给定个体数和所述更新次数,对蝙蝠的飞行速度和位置更新,得到新解;基于最小基尼系数为适应函数,获取所述适应函数值最小的解;基于所述新解和所述最小的解,通过全局寻优得到最优解;基于所述最优解,构建至少一棵决策树,所述决策树根据所述最优解的限度进行生长;基于所述各棵决策树的投票结果,获取各样本的投票分数,以获取所述各棵决策树中的误差率矩阵;获取所述各样本节点变量的重要性评分;基于所述各样本节点变量的重要性评分,获取所述数据网络节点。3.根据权利要求2所述的基于大数据的故障溯源方法,其特征在于,所述RF的初始参数为,x0=(n_estimators,max_depth),所述n_estimators为树的数量,所述max_depth为树的最大深度;所述最优解为,x
*
=(n_estimators_best,max_depth_best);所述决策树棵树基于所述最优解中的n_estimators_best决定,所述各决策树基于所述最优解中的max_depth_best限度生长;其中,所述x0=(n_estimators,max_depth)设置为,x0=(1,1),所述蝙蝠形式设置为均匀分布形式,所述给定个体数设置为20,所述更新次数为1000。4.根据权利要求3所述的基于大数据的故障溯源方法,其特征在于,基于所述各棵决策树的投票结果,获取各样本的投票分数,以获取所述各棵决策树中的误差率矩阵,包括:对所述各棵决策树进行投票,获取每个所述样本的投票分数为s
j
=s1,s2,
…
,s
n
‑
m
;改变所述各样本节点变量的数值,获取新测试样本并对所述样本进行投票,获得第i棵树的误差率矩阵基于所述各样本节点变量的重要性评分,获取所述数据网络节点,包括:得到节点变量x
i
的重要性评分选取评分高的变量作为数据网络节点。5.根据权利要求1所述的基于大数据的故障溯源方法,其特征在于,基于所述数据网络
...
【专利技术属性】
技术研发人员:商国庆,
申请(专利权)人:中国第一汽车股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。