基于模糊规则的煤矿生产多维度数据异常概率预测方法技术

技术编号:27393375 阅读:22 留言:0更新日期:2021-02-21 14:02
一种基于模糊规则的煤矿生产多维度数据异常概率预测方法,涉及工业数据异常检测领域。该预测方法,首先建立异常检测模型,通过样本数据对异常检测模型进行训练,最后利用异常检测模型对矿山的采煤设备故障、输送设备故障进行提前预警。这种方法有效地实现了异常数据的检测,并在一定程度上实现了在真实异常发生前提供预警的功能,具有较强的通用性和扩展性。性。性。

【技术实现步骤摘要】
基于模糊规则的煤矿生产多维度数据异常概率预测方法


[0001]本专利技术涉及工业数据异常检测领域,特别涉及一种基于模糊规则的煤矿生产多维度数据异常概率预测方法。

技术介绍

[0002]在煤矿生产的过程中,由于机器设备的长时间运行,机器设备常常会发生故障,这为生产安全带来了一定的隐患。在工业生产中,对机器设备的故障进行及时的检测是十分重要的。现有的研究方法通常是在故障发生之后,对故障进行检测,因而存在一定的滞后性。若在设备故障发生之前,对机器发生故障的可能性进行预测并进行风险提示,则可以有效的降低设备的故障率,为企业降低损失。
[0003]对于机器设备的故障检测,常用的方法为基于统计模型的方法、基于距离的方法、基于密度的方法、基于聚类的方法。这些方法通常只适用于低维空间的异常检测,且计算复杂度较高。对于高维空间的异常检测,这些模型通常表现较差。

技术实现思路

[0004]针对现有技术存在的不足,本专利技术的目的是提供一种基于模糊规则的煤矿生产多维度数据异常概率预测方法。
[0005]本专利技术所采用的技术方案是:一种基于模糊规则的煤矿生产多维度数据异常概率预测方法,其技术要点是,包括以下步骤:
[0006]数据预处理的步骤,首先获取样本数据,主要包括机组轴承温度、电机工作电流值、电压值、电机转速、运行输出功率、电机转矩、传送带空转率以及传送带的震动频率,然后对样本数据进行预处理;
[0007]获取数据异常程度值的步骤,读取预处理后的样本数据,选择逻辑回归模型(LR)、支持向量机模型(SVM)、决策树模型(DecisionTree)或随机森林模型(Randomforest)中的任一个,计算样本数据的异常程度值;
[0008]建立异常检测模型的步骤,对样本数据的异常程度值进行分类,确定异常程度级别,根据模糊规则建立异常检测模型;通过异常检测模型获取样本数据的异常概率值,根据异常概率值与正常概率的比较结果,确定损失函数,用于优化和调整最初的异常检测模型;
[0009]对煤矿生产多维度数据进行检测的步骤,利用异常检测模型对实时采集到的煤矿生产多维度数据进行检测,对可能发生的采煤设备故障、输送设备故障进行预警。
[0010]上述方案中,所述的模糊规则是指:
[0011]设z为异常程度值,则所述的异常程度级别分为:
[0012]若z<0.3,则表示异常程度非常小A;
[0013]若0.3≤z<0.5,则表示异常程度较小B;
[0014]若0.5≤z<0.8,则表示异常程度较大C;
[0015]若z≥0.8,则表示异常程度非常大D;
[0016]将异常等级进行分级,0级表示正常,1级表示异常;
[0017]设x表示异常程度值,y表示异常等级,定义模糊规则如下:
[0018]规则1:如果异常程度值在0到0.3之间,那么将异常等级定为0级;
[0019]规则2:异常程度值在0.3到0.5,异常等级定为0级;
[0020]规则3:异常程度值在0.5到0.8,异常程度定为1级;
[0021]规则4:异常程度值在0.8到1,异常等级定为1。
[0022]上述方案中,数据预处理的步骤中,所述的对数据进行预处理,包括对采集到的空数据进行清理的步骤;对高于或低于阈值的无效数据以及重复数据进行清理的步骤;转换数据类型的步骤,即将传感器采集并记录的数据转变为异常检测模型所需要的数据类型。
[0023]本专利技术的有益效果是:该基于模糊规则的煤矿生产多维度数据异常概率预测方法,首先建立异常检测模型,通过样本数据对异常检测模型进行训练,最后利用异常检测模型对矿山的采煤设备故障、输送设备故障进行提前预警。这种方法有效地实现了异常数据的检测,并在一定程度上实现了在真实异常发生前提供预警的功能,具有较强的通用性和扩展性。
附图说明
[0024]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可根据这些附图获得其他的附图。
[0025]图1为本专利技术实施例中基于模糊规则的煤矿生产多维度数据异常概率预测方法流程图;
[0026]图2为本专利技术实施例中随机森林模型子树1结构示意图;
[0027]图3为本专利技术实施例中随机森林模型子树2结构示意图。
具体实施方式
[0028]使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图1~3和具体实施方式对本专利技术作进一步详细的说明。
[0029]实施例1:
[0030]本实施例以一个多维工业数据集为例,对具体流程作详细介绍。前期准备:在Windows 平台上配置python运行环境,同时安装好keras、tensorflow、sklearn等必需库文件并进行配置。
[0031]步骤1,数据预处理的步骤。首先是读取原始的样本数据,主要包括整个煤矿传送过程生产线上所有电机机组的机组轴承温度、电机工作电流、电机电压、电机转速、运行输出功率、电机转矩等原始信息以及传送带空转率、传送带的震动频率等传送设备的运行数据。然后进行样本数据的预处理,也即数据清理过程,具体包括:(1)无效数据的剔除:通过判断每条数据是否为空可以剔除掉因传感器故障或其他因素造成的空数据,通过判断各电压电流数值的大小是否在合理范围内,剔除掉因采集过程错误产生的明显高于或者低于合理范围的错误数据;在数据存储过程中可能会产生各种存储格式的错误以及重复存储错
误,增加空格或其他分隔符,通过正则表达式等手段,去掉其中的各种格式错误,分析各个数据的相似性和实际意义,可以去掉各种冗余重复数据,既减轻计算量,又可以避免因数据冗余对异常检测模型训练产生的影响;(2)对数据格式进行转变:因为工业现场采用的PLC等设备存储的数据格式与实际需求会存在很多不同,为了方便数据的后续使用,需要将数据转变统一格式,比如统一变为浮点型数据以及将数值变量转为分类变量等。
[0032]将原始的样本数据以表格(如csv格式)的形式进行存储,方便进行数据读取;在处理之后的数据表格中,会将第一列用来存放时间戳(timestamps)信息,用来标注所有数据的时间序列信息,同时为了处理方便,将数据表中的第二列标注为真实异常与否的标签列(labels), 其中“Labels”取值有两类,分别为0和1。“0”表示样本正常,“1”表示样本异常。
[0033]本实施例中获取到的部分样本数据如表1所示:
[0034]表1为原始的样本数据
[0035][0036]步骤2,获取数据异常程度值的步骤。读取预处理后的原始的样本数据,选择随机森林模型(Randomforest)对样本数据进行处理。
[0037]首先,第一个样本数据(T=80,I1=50,V1=380,I2=51,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于模糊规则的煤矿生产多维度数据异常概率预测方法,其特征在于,包括以下步骤:数据预处理的步骤,首先获取样本数据,主要包括机组轴承温度、电机工作电流值、电压值、电机转速、运行输出功率、电机转矩、传送带空转率以及传送带的震动频率,然后对样本数据进行预处理;获取数据异常程度值的步骤,读取预处理后的样本数据,选择逻辑回归模型、支持向量机模型、决策树模型或随机森林模型中的任一个,计算样本数据的异常程度值;建立异常检测模型的步骤,对样本数据的异常程度值进行分类,确定异常程度级别,根据模糊规则建立异常检测模型;通过异常检测模型获取样本数据的异常概率值,根据异常概率值与正常概率的比较结果,确定损失函数,用于优化和调整最初的异常检测模型;对煤矿生产多维度数据进行检测的步骤,利用异常检测模型对实时采集到的煤矿生产多维度数据进行检测,对可能发生的采煤设备故障、输送设备故障进行预警。2.如权利要求1所述的基于模糊规则的煤矿生产多维度数据异常概率预测方法,其特征在于,所述的模糊规则是指:设z为异常程度...

【专利技术属性】
技术研发人员:孙俊东常俊刘胜志杨彦飞李艳杜垣江贾子熙
申请(专利权)人:神华北电胜利能源有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1