当前位置: 首页 > 专利查询>东北大学专利>正文

一种面向工业大数据的产品质量多源深度融合预报方法技术

技术编号:24455822 阅读:59 留言:0更新日期:2020-06-10 15:31
本发明专利技术提供一种面向工业大数据的产品质量多源深度融合预报方法,涉及工业大数据处理与复杂工业智能建模技术领域。该方法首先收集实际工业现场中的生产数据,并进行数据清洗与数据预处理,统一样本的数据维度;将生产过程数据按照工业生产的实际工艺流程与数据特征分为不同的数据块,同时求取每个数据块与最终质量数据的相关系数;针对不同的数据块,分别设计特定的深度学习网络提取隐含在数据内部的特征信息;利用之前求取的相关系数,为各个数据块提取到的特征信息进行加权融合,并利用一个单层神经网络对产品质量进行预报。该方法通过一种特征融合的思想,将复杂工业过程中的多源异构数据进行深度融合,实现对产品质量的精确预报。

A multi-source deep fusion prediction method of product quality for industrial big data

【技术实现步骤摘要】
一种面向工业大数据的产品质量多源深度融合预报方法
本专利技术涉及工业大数据处理与复杂工业智能建模
,尤其涉及一种面向工业大数据的产品质量多源深度融合预报方法。
技术介绍
近些年来,随着人工智能在理论与技术方面发展的越来越成熟,大数据的应用也越来越广泛,并且在医学,电子信息,图像识别等领域取得了相对较成熟的结果。作为一种分析大数据的有效手段,深度学习在近些年来受到越来越多人的关注,同时在各个领域中取得了突破性的成就。利用深度学习方法处理大数据的好处是,它能够利用有监督或者半监督的学习方法提取大数据中的有效特征,不需要人为手动提取特征。尽管目前的深度学习方法能够有效的处理大数据中的高维数据,通过智能算法自动挖掘高维数据中的特征,然而目前的深度学习方法需要大量的统一维度的训练样本,这在实际应用中会产生许多困扰。深度学习算法能够从大量的训练样本中发掘规律,但这要求所有样本的输入数据维度相同,然而现实中的数据往往难以保证具有统一的输入维度,尤其对于工业数据来说。复杂工业数据大多来源于多个传感器,数据存储格式因数据的来源不同而不同,因此样本的输入数据往往呈现出多源异构性,这对利用复杂工业大数据进行建模提出了挑战。
技术实现思路
本专利技术要解决的技术问题是针对上述现有技术的不足,提供一种面向工业大数据的产品质量多源深度融合预报方法,通过充分挖掘隐含在复杂工业大数据中的规律,对最终的产品质量进行预报。为解决上述技术问题,本专利技术所采取的技术方案是:一种面向工业大数据的产品质量多源深度融合预报方法,包括以下步骤:步骤1、采集实际工业现场中的多源异构生产数据作为样本数据,并存储到数据库;利用样本划分算法,将采集到的数据样本划分为训练集、验证集、测试集;步骤2、将采集到的样本数据利用数据清洗算法去除数据中的异常样本,同时利用数据补齐算法对输入数据进行数据预处理,使所有样本数据的维度统一;步骤3、将步骤2处理过的多源异构数据根据工业生产的实际工艺流程与数据特征划分为不同的一维数据块、二维数据块和三维数据块,对不同的数据块分别求取均值,方差,最大值,最小值,用以表征该整体数据块的信息,将上述所有的统计量组合成一维统计指标向量,表示如下:其中,分别表示第i个样本数据所在的第n个数据块的均值、方差、最大值和最小值;计算所有样本数据的统计指标S={s1,s2,…,si}与最终的产品质量标签Y={y1,y2,…,yi}之间的最大互信息系数(MaximalInformationCoefficient,即MIC),得到连续变量S与Y之间的相关系数,表示如下:其中,分别为第n个数据块的均值、方差、最大值、最小值与最终的产品质量标签的最大互信息系数;将每个数据块的均值、方差、最大值、最小值与最终的产品质量标签之间的最大互信息系数求和,得到不同数据块与最终产品质量之间的相关系数M={m1,m2,…,mn},其中,mn表示第n个数据块与最终产品质量之间的相关系数,即步骤4、针对复杂工业过程中产生的不同数据块,分别使用不同的深度学习网络作为数据特征提取层,挖掘隐含在数据内部的特征;针对一维数据块,采用LSTM网络提取数据特征,如下公式所示:A(1)=fLSTM(I(1);θLSTM)其中,I(1)表示输入到LSTM网络的一维数据,A(1)表示一维数据经过LSTM网络后提取到的特征,fLSTM(·)表示LSTM的网络结构,θLSTM表示LSTM中参数的集合;针对二维数据块,采用InceptionV4CNN架构提取数据特征;去掉网络框架中的最后一层输出层,只保留其中的特征提取层,并利用二维数据对CNN模型进行训练,提取二维数据中的特征,如下公式所示:A(2)=fCNN(I(2);θCNN)其中,I(2)表示输入到CNN网络的二维数据,A(2)表示二维数据经过CNN网络后提取到的特征,fCNN(·)表示CNN的网络结构,θCNN表示CNN中参数的集合;针对三维数据,采用3D卷积神经网络提取数据特征,如下公式所示:A(3)=f3D-CNN(I(3);θ3D-CNN)其中,I(3)表示输入到3D卷积神经网络的三维数据,A(3)表示三维数据经过3D-CNN网络后提取到的特征,f3D-CNN(·)表示3D卷积神经网络的网络结构,θ3D-CNN表示3D卷积神经网络中参数的集合;步骤5、根据步骤3中计算得到的不同数据块与最终产品质量之间的相关系数,为步骤4中提取到的每个数据块中的数据特征分配权重,同时将加权后的数据特征进行融合,得到加权融合后的数据特征,如下公式所示:其中,An表示第n个数据块通过相应的数据提取层后得到的数据特征向量,A′表示数据加权融合后的数据特征;将加权融合后的数据特征输入到一个单层神经网络中,从数据特征中提取到生产过程数据中隐含的产品质量标签信息,如下公式所示:Z=f(A′),Z∈R1×C其中,f(·)表示一个单层的神经网络,C表示最终的产品质量标签数量,Z=[z1,z2,…,zC]表示从生产过程数据中提取到的产品质量标签信息,其中每个数值对应一个产品质量标签;利用softmax函数将提取到的质量标签信息做空间归一化,得到最终的质量标签预测值其中,如下公式所示:使用交叉熵损失函数计算质量标签预测值与真实标签y之间的损失,如下公式所示:步骤6、利用步骤2中经过数据预处理后得到的产品数据,训练步骤3、步骤4、步骤5中建立起来的神经网络结构,得到产品质量的预报模型F,通过该预报模型利用工业生产过程中的多源异构数据预报出产品的质量。采用上述技术方案所产生的有益效果在于:本专利技术提供的一种面向工业大数据的产品质量多源深度融合预报方法,能够有效的解决复杂工业生产过程中由于数据存储格式不同而导致的问题,能够有效的融合生产过程中产生的多源异构数据,进而建立产品质量的预报模型,相比于传统的建模方法,能够有效的利用隐含在多源异构数据中的信息,使模型的预报准确率更高,从而指导生产过程,降低产品的不合格率,提高生产效益。附图说明图1为本专利技术实施例提供的一种面向工业大数据的产品质量多源深度融合预报方法的流程图。图2为本专利技术实施例提供的一种面向工业大数据的产品质量多源深度融合预报方法的过程示意图。具体实施方式下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。本实施例以钢板生产过程为例,采用本专利技术的面向工业大数据的产品质量多源深度融合预报方法对钢板生产过程中的钢板板形质量进行预报。一种面向工业大数据的产品质量多源深度融合预报方法,如图1和2所示,包括以下步骤:步骤1、采集实际工业现场中的多源异构生产数据作为样本数据,并存储到关系型数据库;利用样本划分算法,将采集到的数据样本划分为训练集、验证集、测本文档来自技高网...

【技术保护点】
1.一种面向工业大数据的产品质量多源深度融合预报方法,其特征在于:包括以下步骤:/n步骤1、采集实际工业现场中的多源异构生产数据作为样本数据,并存储到数据库;利用样本划分算法,将采集到的数据样本划分为训练集、验证集、测试集;/n步骤2、将采集到的样本数据利用数据清洗算法去除数据中的异常样本,同时利用数据补齐算法对输入数据进行数据预处理,使所有样本数据的维度统一;/n步骤3、将步骤2处理过的多源异构数据根据工业生产的实际工艺流程与数据特征分为不同的数据块,将每个数据块的均值、方差、最大值、最小值与最终的产品质量标签之间的最大互信息系数求和,得到不同数据块与最终产品质量之间的相关系数;/n步骤4、针对复杂工业过程中产生的不同数据块,分别使用不同的深度学习网络作为数据特征提取层,挖掘隐含在数据内部的特征;/n步骤5、根据步骤3中计算得到的不同数据块与最终产品质量之间的相关系数,为步骤4中提取到的每个数据块中的数据特征分配权重,同时将加权后的数据特征进行融合,得到加权融合后的数据特征;将加权融合后的数据特征输入到一个单层神经网络中,从数据特征中提取到生产过程数据中隐含的产品质量标签信息;利用softmax函数将提取到的质量标签信息做空间归一化,得到最终的质量标签预测值;使用交叉熵损失函数计算质量标签预测值与真实标签之间的损失;/n步骤6、利用步骤2中经过数据预处理后得到的产品数据,训练步骤3、步骤4、步骤5中建立起来的神经网络结构,得到产品质量的预报模型F,通过该预报模型利用工业生产过程中的多源异构数据预报出产品的质量。/n...

【技术特征摘要】
1.一种面向工业大数据的产品质量多源深度融合预报方法,其特征在于:包括以下步骤:
步骤1、采集实际工业现场中的多源异构生产数据作为样本数据,并存储到数据库;利用样本划分算法,将采集到的数据样本划分为训练集、验证集、测试集;
步骤2、将采集到的样本数据利用数据清洗算法去除数据中的异常样本,同时利用数据补齐算法对输入数据进行数据预处理,使所有样本数据的维度统一;
步骤3、将步骤2处理过的多源异构数据根据工业生产的实际工艺流程与数据特征分为不同的数据块,将每个数据块的均值、方差、最大值、最小值与最终的产品质量标签之间的最大互信息系数求和,得到不同数据块与最终产品质量之间的相关系数;
步骤4、针对复杂工业过程中产生的不同数据块,分别使用不同的深度学习网络作为数据特征提取层,挖掘隐含在数据内部的特征;
步骤5、根据步骤3中计算得到的不同数据块与最终产品质量之间的相关系数,为步骤4中提取到的每个数据块中的数据特征分配权重,同时将加权后的数据特征进行融合,得到加权融合后的数据特征;将加权融合后的数据特征输入到一个单层神经网络中,从数据特征中提取到生产过程数据中隐含的产品质量标签信息;利用softmax函数将提取到的质量标签信息做空间归一化,得到最终的质量标签预测值;使用交叉熵损失函数计算质量标签预测值与真实标签之间的损失;
步骤6、利用步骤2中经过数据预处理后得到的产品数据,训练步骤3、步骤4、步骤5中建立起来的神经网络结构,得到产品质量的预报模型F,通过该预报模型利用工业生产过程中的多源异构数据预报出产品的质量。


2.根据权利要求1所述的一种面向工业大数据的产品质量多源深度融合预报方法,其特征在于:所述步骤3的具体方法为:
将采集到的生产过程中的多源异构数据根据工业生产的实际工艺流程与数据特征划分为一维数据块、二维数据块和三维数据块,对不同的数据块分别求取均值、方差、最大值和最小值,用以表征该整体数据块的信息,将上述所有的统计量组合成一维统计指标向量,表示如下:



其中,分别表示第i个样本数据所在的第n个数据块的均值、方差、最大值和最小值;
计算所有样本数据的统计指标S={s1,s2,…,si}与最终的产品质量标签Y={y1,y2,…,yi}之间的最大互信息系数,得到连续变量S与Y之间的相关系数,表示如下:



其中,分别为第n个数据块的均值、方差、最大值、最小值与最终的产品质量标签的最大互信息系数;
将每个数...

【专利技术属性】
技术研发人员:刘长鑫马宇飞丁进良柴天佑李智浩
申请(专利权)人:东北大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1