The invention discloses a data-driven fault diagnosis method for industrial production process, which includes: calculating average deviation and variance, extracting feature data from multi-dimensional data in industrial production process, obtaining feature data and constructing original input sample set; using original input sample set, using trained random forest model, diagnosing industrial production process for fault diagnosis. According to whether the diagnosis results are faulty or not and the type of faults, the causes of faults in industrial production process are analyzed and solved. The invention adopts particle swarm optimization algorithm and optimizes two key parameters of Stochastic Forest model, which provides a feasible and efficient method for optimizing Stochastic Forest parameters, and improves the accuracy of fault diagnosis in industrial production process by using stochastic forest algorithm.
【技术实现步骤摘要】
一种基于数据驱动的工业生产过程故障诊断方法
本专利技术属于工业生产过程诊断领域,更具体地,涉及一种基于数据驱动的工业生产过程故障诊断方法。
技术介绍
工业生产过程系统越来越复杂,各个流程工序相互关联、相互影响,一旦其中任何一个过程出现故障,会导致系统功能失效,影响正常生产,造成企业重大经济损失,严重时还会造成人员安全事故,给国家和人民带来损失。因此,从安全生产和企业经济效益的角度来说,通过对工业生产过程数据的分析进行故障诊断是十分必要的。现有的故障诊断方法可以分为基于机理模型的方法、基于知识的方法、基于信号处理的方法和基于人工智能的方法。基于机理模型的方法具有良好诊断效果的前提是建立精确的模型,随着生产制造系统的集成化与复杂化,构建这些系统的精确机理模型是很困难的,基于机理模型的方法在实际应用中很难起到良好的诊断效果。基于知识的方法是将故障诊断相关的专家经验知识进行处理,模拟人的决策方式,实现复杂系统的智能化诊断。这种方法构建的模型大部分不具有自我学习能力,不能满足需求。基于信号处理的方法是对信号进行处理和特征提取来进行故障诊断,但是没有固定的特征提取方案,不同类型数据的特征提取方式不近相同。近年来,基于人工智能的方法逐渐兴起,提高了诊断效率和识别率。但在使用人工智能方法对工业生产过程数据进行故障诊断时,人工智能算法的模型和模型参数往往需要优化,如果优化效果不好,则会降低故障诊断的准确率,诊断结果与实际偏差较大。
技术实现思路
针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于数据驱动的工业生产过程故障诊断方法,由此解决现有的故障诊断方法诊断结果偏差大 ...
【技术保护点】
1.一种基于数据驱动的工业生产过程故障诊断方法,其特征在于,包括:(1)计算工业生产过程中的多维数据的平均偏差和方差,以对工业生产过程中的多维数据进行特征提取,得到特征数据,由所述特征数据构建原始输入样本集;(2)利用原始输入样本集,使用训练好的随机森林模型,对待诊断工业生产过程进行故障诊断,得到诊断结果;(3)根据诊断结果是否有故障,以及故障类型,对待诊断工业生产过程故障产生的原因进行分析和解决。
【技术特征摘要】
1.一种基于数据驱动的工业生产过程故障诊断方法,其特征在于,包括:(1)计算工业生产过程中的多维数据的平均偏差和方差,以对工业生产过程中的多维数据进行特征提取,得到特征数据,由所述特征数据构建原始输入样本集;(2)利用原始输入样本集,使用训练好的随机森林模型,对待诊断工业生产过程进行故障诊断,得到诊断结果;(3)根据诊断结果是否有故障,以及故障类型,对待诊断工业生产过程故障产生的原因进行分析和解决。2.根据权利要求1所述的方法,其特征在于,步骤(1)包括:选取工业生产过程中的变量Ak从t时刻开始的连续h个值,计算这h个值与该变量Ak的偏差,然后将这些偏差的平均值作为特征值et,k,另外再计算这h个值与该变量Ak的方差,并将这些方差的平均值作为另一个特征值由此,对于工业生产过程中的r个变量,能够构造出包含2*r个特征值的特征向量:将所述特征向量经归一化处理后,得到特征数据,构建原始输入样本集S。3.根据权利要求1所述的方法,其特征在于,所述步骤(2)的训练好的随机森林RF模型,训练过程包括:(2.1)计算经过标记的工业生产过程中的多维数据的平均偏差和方差,以对工业生产过程中的多维数据进行特征提取,得到特征数据,由所述特征数据构建原始输入样本集;(2.2)采用粒子群算法优化所述随机森林模型的参数,将利用所述原始输入样本集得到的分类正确率最高的随机森林模型参数作为所述随机森林模型的最优参数组合,得到训练好的随机森林模型,以通过训练好的RF模型对待诊断工业生产过程进行故障诊断,其中,所述随机森林模型中的参数包括决策树棵数n和特征子集大小κ。4.根据权利要求3所述的方法,其特征在于,标记的工业生产过程中的多维数据是指已知生产过程状态是正常状态的数据还是故障状态的数据,以及是属于哪一种故障状态。5.根据权利要求3所述的方法,其特征在于,步骤(2.2)包括:(2.2.1)初始化参数,随机为粒子种群中的每个粒子指定初始位置和速度参数,预设最大迭代次数、粒子位置的限定范围、粒子速度的限定范围及粒子种群规模,其中,以空间向量...
【专利技术属性】
技术研发人员:彭刚,成栋梁,武登泽,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。