当前位置: 首页 > 专利查询>贵州科学院专利>正文

基于自编码器的极限学习机在工业生产预测的建模应用制造技术

技术编号:22135851 阅读:88 留言:0更新日期:2019-09-18 09:28
本发明专利技术公开了一种基于自编码器的极限学习机在工业生产预测的建模应用,包括:使用自编码器对输入数据进行编码,以获取原始数据的主要特征,去除数据中的噪声和冗余信息。根据平均相对误差比较不同自编码器结构对应的自编码器重构损失,选择损失最小的自编码器结构作为最终的自动编码器,使用选择的自编码器对所述原始数据进行编码,作为极限学习机的输入。根据Moore‑Penrose广义逆矩阵计算极限学习机的输出权重,获得极限学习机的最终输出。本发明专利技术通过去除数据之中的噪声和冗余信息,将自编码器提取的主要特征用作极限学习机的输入,降低了极限学习机对于隐藏层节点选择的敏感性,提高了模型预测的精度和鲁棒性。

Modeling and Application of Extreme Learning Machine Based on Self-Encoder in Industrial Production Forecasting

【技术实现步骤摘要】
基于自编码器的极限学习机在工业生产预测的建模应用
本专利技术涉及工业生产预测的
,尤其涉及一种基于自编码器的极限学习机在工业生产预测的建模应用。
技术介绍
近年来,化工生产技术取得了一定进展,其中精对苯二甲酸(PureTerephthalicAcid,PTA)发挥了关键作用。PTA在市场上的需求不断增加,其生产成本影响复杂化学过程中的整体能效水平。在PTA生产技术中,节约能源的有效方法之一是建立准确的生产预测模型。但是,由于PTA生产过程中需要处理大量数据特征和各种影响因素,因此变量之间存在很强的非线性关系。基于统计的传统生产预测模型过于复杂,而且需要相关领域知识的支持,因此已经不适用于对越来越复杂的石化生产数据建立自适应生产预测模型。人工神经网络(ArtificialNeuralNetwork,ANN)是生物神经网络的近似模拟,可用于分类、视觉识别等监督任务,也可用作无监督任务。ANN具有数据驱动、非线性逼近和并行分布式处理的优点。因此,它已经应用于环境科学、电力工业、建筑工程、公路运输和石油化学工业等。反向传播(BackPropagation,BP)神经网络是一种计算神经元相对于最终误差的梯度的算法,具有良好的性能,但是BP的结构需要根据经验来确定,对于开发人员提出了更高的要求。
技术实现思路
为解决现有技术存在的局限和缺陷,本专利技术提供一种基于自编码器的极限学习机在工业生产预测的建模应用,包括:使用自编码器对输入数据进行编码,以获取原始数据的主要特征,计算公式如下:z=f(wx+b)其中,x为输入数据,w为隐藏层的权重,b为隐藏层的偏置;使用所述自编码器最小化输出数据和输入数据之间的差别,计算公式如下:E=L(x,g(f(x)))其中,L为衡量所述原始数据和重构数据之间差距的损失函数;根据平均相对误差比较不同自编码器结构对应的自编码器损失,选择损失最小的自编码器结构作为最终的自动编码器;使用选择的自编码器对所述原始数据进行编码,作为极限学习机的输入;极限学习机的最终输出表示如下:其中,Wk为第k个隐藏节点的输入权重,bk为第k个隐藏节点的偏置,g为激活函数,βk为第k个隐藏节点的输出权重;将极限学习机的最终输出表示为矩阵形式:Y=Hβ其中,H为隐藏层的输出结果,β为隐藏层的输出权重,Y为极限学习机的最终输出结果;根据极限学习机获得具有最小化输出误差的输出权重计算公式如下:其中,为真实输出值。可选的,所述使用自编码器对输入数据进行编码的步骤包括:获取原始数据的样本集D=(Xi,Yi),其中,Xi=[xi1,xi2,...,xin]∈Rn为输入向量,Yi=[yi1,yi2,...,xim]∈Rm为目标向量;选择最大值归一化处理,以保持所述原始数据的稀疏性,计算公式如下:其中,xi,original为所述原始数据第i维的值,xi,max为所述原始数据第i维的最大值,xi,normed为归一化之后的结果。可选的,还包括:根据Moore-Penrose广义逆矩阵计算极限学习机的输出权重,计算公式如下:其中,为极限学习机的输出权重。可选的,所述使用所述自编码器最小化输出数据和输入数据之间的差别的步骤包括:所述自编码器的编码过程表示如下:z=f(wx+b)所述自解码器的解码过程表示如下:可选的,所述激活函数为sigmoid函数。可选的,所述损失函数L为最小均方误差。本专利技术具有下述有益效果:本专利技术提供的一种基于自编码器的极限学习机在工业生产预测的建模应用,包括:使用自编码器对输入数据进行编码,以获取原始数据的主要特征,去除数据中的噪声和冗余信息。根据平均相对误差比较不同自编码器结构对应的自编码器重构损失,选择损失最小的自编码器结构作为最终的自动编码器,使用选择的自编码器对所述原始数据进行编码,作为极限学习机的输入。根据Moore-Penrose广义逆矩阵计算极限学习机的输出权重,获得极限学习机的最终输出。本专利技术提供的技术方案通过去除数据之中的噪声和冗余信息,对复杂数据执行降维或者特征学习。本专利技术将自编码器提取的主要特征用作极限学习机的输入,降低了极限学习机对于隐藏层节点选择的敏感性,提高了模型预测的精度和鲁棒性。附图说明图1为本专利技术实施例一提供的极限学习机的基本架构图。图2为本专利技术实施例一提供的自编码器的基本架构图。图3为本专利技术实施例一提供的精对苯二甲酸装置的溶剂脱水塔的示意图。其中,附图标记为:1、共沸蒸馏塔;2、回流罐;3、空气冷凝;4、水冷凝。具体实施方式为使本领域的技术人员更好地理解本专利技术的技术方案,下面结合附图对本专利技术提供的基于自编码器的极限学习机在工业生产预测的建模应用进行详细描述。实施例一极限学习机(ExtremeLearningMachine,ELM)只有一个隐藏层,以简化人工神经网络(ArtificialNeuralNetwork,ANN)的训练和泛化过程。ELM随机初始化输入权重和阈值,而不是使用梯度下降算法迭代地更新网络权重,而且输出权重可以通过求解矩阵方程进行计算。ELM解决了ANN在梯度下降过程中容易陷入局部最小值的问题。ELM已经广泛应用于食品生产、风速预测、生物系统工程、非线性系统控制和区域供热系统等。但是,ELM的有效性与隐藏层节点数量的选择有很大关系。由于缺乏稳定性,ELM在实际应用中往往表现不佳。基于主成分提取的鲁棒极限学习机(PCE-RELM)模型用于解决传统ELM的局限性。主元分析(PrincipalComponentAnalysis,PCA)将原始数据投影到具有最大方差的几个相互正交的方向,以期望保留最多的样本信息。PCA是一种常用的降维方法,可以提取原始数据的主要特征。但是,PCA只能执行线性变换以获得低维的数据集。自编码器(Autoencoder,AE)是一种非线性降维方法,与PCA相比,AE更加灵活,可以表示线性和非线性变换。本实施例提出了一种基于AE的ELM模型(AE-ELM),通过去除数据中的噪声和冗余信息,AE可以对复杂数据执行降维或特征学习。本实施例通过原始数据的主要特征作为ELM的输入,可以提高传统ELM模型的精度和鲁棒性。本实施例提供一种基于自编码器的极限学习机在工业生产预测的建模应用,用于对工业过程数据进行预测建模。AE可以通过消除原始复杂数据之间的线性相关性来提取具有较低维度的主要特征。然后,将AE提取的主要特征用作传统ELM的输入,降低了ELM对于隐藏层节点选择的敏感性,提高了模型预测的精度和鲁棒性。图1为本专利技术实施例一提供的极限学习机的基本架构图,图2为本专利技术实施例一提供的自编码器的基本架构图。如图1-2,本实施例获取工业生产数据样本集D=(Xi,Yi),其中,Xi=[xi1,xi2,...,xin]∈Rn是输入向量,Yi=[yi1,yi2,...,xim]∈Rm是目标向量。首先将样本集分为训练数据集和测试数据集,为了使输入数据的各个维度具有相同的尺度,需要对输入数据进行归一化处理。本实施例选择最大值归一化处理,以保持原始数据的稀疏性:其中,xi,original代表原始输入数据第i维的值,xi,max代表原始数据第i维的最大值,xi,normed表示归一化后的结果。本实施例使用AE对输入数据进行编码,获取原始数据的主要特征,其中编码本文档来自技高网...

【技术保护点】
1.一种基于自编码器的极限学习机在工业生产预测的建模应用,其特征在于,包括:使用自编码器对输入数据进行编码,以获取原始数据的主要特征,计算公式如下:z=f(wx+b)其中,x为输入数据,w为隐藏层的权重,b为隐藏层的偏置;使用所述自编码器最小化输出数据和输入数据之间的差别,计算公式如下:E=L(x,g(f(x)))其中,L为衡量所述原始数据和重构数据之间差距的损失函数;根据平均相对误差比较不同自编码器结构对应的自编码器损失,选择损失最小的自编码器结构作为最终的自动编码器;使用选择的自编码器对所述原始数据进行编码,作为极限学习机的输入;极限学习机的最终输出表示如下:

【技术特征摘要】
1.一种基于自编码器的极限学习机在工业生产预测的建模应用,其特征在于,包括:使用自编码器对输入数据进行编码,以获取原始数据的主要特征,计算公式如下:z=f(wx+b)其中,x为输入数据,w为隐藏层的权重,b为隐藏层的偏置;使用所述自编码器最小化输出数据和输入数据之间的差别,计算公式如下:E=L(x,g(f(x)))其中,L为衡量所述原始数据和重构数据之间差距的损失函数;根据平均相对误差比较不同自编码器结构对应的自编码器损失,选择损失最小的自编码器结构作为最终的自动编码器;使用选择的自编码器对所述原始数据进行编码,作为极限学习机的输入;极限学习机的最终输出表示如下:其中,Wk为第k个隐藏节点的输入权重,bk为第k个隐藏节点的偏置,g为激活函数,βk为第k个隐藏节点的输出权重;将极限学习机的最终输出表示为矩阵形式:Y=Hβ其中,H为隐藏层的输出结果,β为隐藏层的输出权重,Y为极限学习机的最终输出结果;根据极限学习机获得具有最小化输出误差的输出权重计算公式如下:其中,为真实输出值。2.根据权利要求1所述的基于自编码器的极限学习机在工业生产预测的建模应用,其特征在于,所述使用自编码器对输入数据进行编码的步骤包括:获取原...

【专利技术属性】
技术研发人员:陈恺王雅洁杨冰韩永明耿志强孟庆超于杰张成梅陶衡郝淼
申请(专利权)人:贵州科学院北京化工大学
类型:发明
国别省市:贵州,52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1