当前位置: 首页 > 专利查询>东北大学专利>正文

一种基于混合集成学习的连续退火带钢质量在线检测方法技术

技术编号:15705112 阅读:166 留言:0更新日期:2017-06-26 11:37
本发明专利技术公开一种基于混合集成学习的连续退火产品质量在线检测方法,将AdaBoost中对误差较大样本的重复学习机制引入到Bagging框架中,进一步提升了在线检测方法的精度;同时,Bagging框架中每个子学习机使用随机抽样方式构建其训练样本集合,使得各子学习机的训练样本集合具有差异性,能够提高在线检测方法的泛化能力。经过实际生产数据测试,本发明专利技术所提出的方法能够实现对连续退火带钢产品质量的在线检测,其效果要优于单独使用Bagging或者AdaBoost集成学习建模方法,从而能够帮助连续退火机组提高产品质量控制的水平。

Continuous annealing steel strip quality on-line detection method based on hybrid ensemble learning

The invention discloses a method for on-line detection of the quality of continuous annealing products integrated learning based on iterative learning mechanism on the error of sample AdaBoost into the Bagging framework, to further improve the online detection accuracy; at the same time, the framework of Bagging in each sub machine learning using random sampling method to construct the training sample set, the the machine learning in the training set is different, can improve the generalization ability of on-line detection method. After the actual production test data, this method can realize on-line detection of continuous annealing of steel product quality, its effect is better than using Bagging or AdaBoost integrated modeling method of learning alone, which can help improve the quality of products of continuous annealing unit control level.

【技术实现步骤摘要】
一种基于混合集成学习的连续退火带钢质量在线检测方法
本专利技术属于钢铁企业连续退火过程的自动控制
,特别涉及一种带钢产品质量在线检测方法。
技术介绍
在钢铁企业中,由于连续退火机组的带钢是前后焊接在一起连续生产,带钢在退火之后的质量(通过硬度进行评价)还无法实现在线检测,现场操作人员只能根据经验判断正在生产的带钢的质量,难以提高连续退火生产过程的质量控制水平。针对连续退火生产过程带钢产品质量难以在线检测的问题,论文“基于PLS的连续退火机组带钢质量预报及过程监测系统设计与实现[D]”(汪源,东北大学,2009)所提出的方法只考虑了较少的过程变量并且该方法主要是针对过程监测与故障诊断。专利“一种连续退火产品硬度在线集成学习预报方法”(唐立新,王显鹏,申请号:CN201410843307.8)提出了一种基于AdaBoost的集成学习建模方法,但是AdaBoost方法的不足之处在于:(1)该方法在训练每个子学习机时都使用全部的训练样本,导致训练时间长;(2)当有新的样本加入到训练样本集合中时,需要对所有的子学习机全部重新训练。
技术实现思路
针对现有技术存在的不足,本专利技术提供一种基于混合集成学习的连续退火产品质量在线检测方法。本专利技术的技术方案是:一种基于混合集成学习的连续退火产品质量在线检测方法,包括如下步骤:步骤1:构建训练样本集合:一个训练样本的输出为一条带钢的产品质量,输入为该带钢生产时的过程数据;从连续退火机组的历史数据中采集正常生产工况下的n个样本,建立训练样本集合;步骤2:数据降维:对采集到的样本数据集合进行归一化,然后进行主元分析,得到降维后的训练样本集合L;步骤3:子学习机生成:根据步骤2得到的训练样本集合L,使用基于Bagging和AdaBoost的混合集成学习方法训练得到K个子学习机,方法为:步骤3.1:设定子学习机索引i=1,子学习机的最大数量K;步骤3.2:针对第i个子学习机,如果i=1,则直接从训练样本集合L按照均匀分布进行可放回随机抽样,共获得pn个测试样本,其中0<p<1,如果pn不是整数,则做下取整处理,作为第1个子学习机的训练样本集合;否则,首先选择前一个子学习机中训练误差大于a%的样本,其中a为一个人为设定值,然后再按照均匀分布进行可放回抽样的方式从L中选取其它样本(这些样本与已经加入的误差较大样本不重复),共构成pn个测试样本,作为第i(i>1)个子学习机的训练样本集合Si;步骤3.3:调整训练样本的权重:如果i=1,则所有样本的权重相同,设为1/pn;否则,按照如下方式调整各训练样本的权重:步骤3.3.1:将所加入的误差较大的每个样本j的权重设置为wj=100×ej%,其中ej%为这个样本的绝对误差;步骤3.3.2:将随机抽样获得样本的权重设置为1;步骤3.3.3:对所有样本的权重进行归一化,即每个样本的权重为其中l从1到pn,wl为训练样本集合L中相应样本的权重;步骤3.4:针对给定权重的训练样本集合Si,使用最小二乘支持向量机LSSVM方法训练并得到第i个子学习机,并计算它的均方根误差RMSEi;步骤3.5:设置i=i+1;如果i≤K,则转到步骤3.2;否则转到步骤4;步骤4:子学习机权重确定:根据每个子学习机的均方根误差RMSEi,计算每个子学习机的权重步骤5:集成学习模型应用:在实际生产中,针对每条带钢,根据当前的生产过程数据,计算集成学习机的输出,即最终的带钢产品质量检测值为其中fi为第i个子学习机所输出的带钢质量。最小二乘支持向量机LSSVM方法的步骤包括:步骤1:初始化遗传算法的种群规模为Z,交叉算子为SBX,最大迭代次数M;步骤2:以LSSVM的模型参数:样本误差的惩罚系数γ和核函数参数σ作为变量,即遗传算法的每个解Xj=(γj,σj),随机产生Z个解,针对每个解,使用其所确定的LSSVM模型计算适应度值其中Ol(LSSVMj)表示由解Xj所确定的LSSVM模型针对第l条带钢质量的估计值,yl表示该条带钢质量的实际检测值;步骤3:随机从种群中选取两个父代解,对其执行SBX交叉操作,得到新的中间解X'=(γ',σ');步骤4:产生一个[0,1]内的随机数r,如果r<0.05,则对X'执行变异操作,即将X'的两个变量在其当前值的5%范围内随机产生一个扰动值Δr和Δσ,然后设置γ'=γ'+Δr,σ'=σ'+Δσ,从而得到一个新解Xnew;步骤5:计算Xnew的适应度值,如果其适应度值优于两个父代解中的至少一个,则用Xnew替代父代解中最差的一个,即适应度值最大的一个;步骤6:重复执行Z次步骤3-5,得到新的种群;步骤7:重复执行M次步骤3-6,将最后种群中的最好解所对应的LSSVM模型作为第i个子学习机,然后计算该子学习机针对所有训练样本的均方根误差其中LSSVMi表示由遗传算法所得到的最好解所确定的第i个子学习机;步骤8:子学习机权重确定:根据每个子学习机的均方根误差RMSEi,计算每个子学习机的权重本专利技术的有益效果:本专利技术的连续退火带钢质量在线检测方法将AdaBoost中对误差较大样本的重复学习机制引入到Bagging框架中,进一步提升了在线检测方法的精度;同时,Bagging框架中每个子学习机使用随机抽样方式构建其训练样本集合,使得各子学习机的训练样本集合具有差异性,能够提高在线检测方法的泛化能力。经过实际生产数据测试,本专利技术所提出的方法能够实现对连续退火带钢产品质量的在线检测,其效果要优于单独使用Bagging或者AdaBoost集成学习建模方法,从而能够帮助连续退火机组提高产品质量控制的水平。附图说明图1为本专利技术所提出的混合集成学习建模方法的原理图;图2为本专利技术一种实施方式的连续退火带钢质量在线检测方法流程图;图3为本专利技术一种实施方式的连续退火带钢质量预报值与单独使用Bagging或AdaBoost集成学习方法的带钢质量预报值的比较图。具体实施方式下面结合附图和实施例对本专利技术作进一步说明。针对调质度为T5的带钢,将本专利技术所提出的连续退火带钢质量在线检测方法应用于本实施方式,包括如下步骤:步骤1:构建训练样本集合:一个训练样本的输出为一条带钢的产品质量,为带钢的洛氏硬度,输入为该带钢生产时的过程数据,包括52项:入口厚度、入口宽度、碳含量、硫含量、磷含量、锰含量、氮含量、硅含量和总铝含量、出炉温度、平均卷曲温度、平均精轧温度、平均终轧温度、连续酸洗-轧制延伸率、中央段速度、HF炉1区炉温、HF炉2区炉温、HF炉3区炉温、HF炉4区炉温、HF炉5区炉温、HF炉出口带钢温度、SF炉1区炉温、SF炉2区炉温、SF炉出口带钢温度、SCF炉1区炉温、SCF炉2区炉温、SCF炉出口带钢温度、1C炉1区炉温、1C炉2区炉温、1C炉3区炉温、1C炉冷却气体温度、1C炉出口带钢温度、1OA炉1区炉温、1OA炉2区炉温、1OA炉出口带钢温度、2OA炉1-1区炉温、2OA炉1-2区炉温、2OA炉2-1区炉温、2OA炉2-2区炉温、2OA炉出口带钢温度、2C炉炉温、2C冷却气体温度、2C炉出口带钢温度、WQ炉1区水温、WQ炉2区水温、平整机延伸率、平整机入口带钢张力、平整机中间带钢张力、平整机出口带钢张力、平整机1#机架轧制力和2#机架轧本文档来自技高网...
一种基于混合集成学习的连续退火带钢质量在线检测方法

【技术保护点】
一种基于混合集成学习的连续退火产品质量在线检测方法,其特征在于包括如下步骤:步骤1:构建训练样本集合:一个训练样本的输出为一条带钢的产品质量,输入为该带钢生产时的过程数据;从连续退火机组的历史数据中采集正常生产工况下的n个样本,建立训练样本集合;步骤2:数据降维:对采集到的样本数据集合进行归一化,然后进行主元分析,得到降维后的训练样本集合L;步骤3:子学习机生成:根据步骤2得到的训练样本集合L,使用基于Bagging和AdaBoost的混合集成学习方法训练得到K个子学习机,方法为:步骤3.1:设定子学习机索引i=1,子学习机的最大数量K;步骤3.2:针对第i个子学习机,如果i=1,则直接从训练样本集合L按照均匀分布进行可放回随机抽样,共获得pn个测试样本,其中0<p<1,如果pn不是整数,则做下取整处理,作为第1个子学习机的训练样本集合;否则,首先选择前一个子学习机中训练误差大于a%的样本,其中a为一个人为设定值,然后再按照均匀分布进行可放回抽样的方式从L中选取其它样本(这些样本与已经加入的误差较大样本不重复),共构成pn个测试样本,作为第i(i>1)个子学习机的训练样本集合S...

【技术特征摘要】
1.一种基于混合集成学习的连续退火产品质量在线检测方法,其特征在于包括如下步骤:步骤1:构建训练样本集合:一个训练样本的输出为一条带钢的产品质量,输入为该带钢生产时的过程数据;从连续退火机组的历史数据中采集正常生产工况下的n个样本,建立训练样本集合;步骤2:数据降维:对采集到的样本数据集合进行归一化,然后进行主元分析,得到降维后的训练样本集合L;步骤3:子学习机生成:根据步骤2得到的训练样本集合L,使用基于Bagging和AdaBoost的混合集成学习方法训练得到K个子学习机,方法为:步骤3.1:设定子学习机索引i=1,子学习机的最大数量K;步骤3.2:针对第i个子学习机,如果i=1,则直接从训练样本集合L按照均匀分布进行可放回随机抽样,共获得pn个测试样本,其中0<p<1,如果pn不是整数,则做下取整处理,作为第1个子学习机的训练样本集合;否则,首先选择前一个子学习机中训练误差大于a%的样本,其中a为一个人为设定值,然后再按照均匀分布进行可放回抽样的方式从L中选取其它样本(这些样本与已经加入的误差较大样本不重复),共构成pn个测试样本,作为第i(i>1)个子学习机的训练样本集合Si;步骤3.3:调整训练样本的权重:如果i=1,则所有样本的权重相同,设为1/pn;否则,按照如下方式调整各训练样本的权重:步骤3.3.1:将所加入的误差较大的每个样本j的权重设置为wj=100×ej%,其中ej%为这个样本的绝对误差;步骤3.3.2:将随机抽样获得样本的权重设置为1;步骤3.3.3:对所有样本的权重进行归一化,即每个样本的权重为其中l从1到pn,wl为训练样本集合L中相应样本的权重;步骤3.4:针对给定权重的训练样本集合Si,使用最小二乘支持向量机LSSVM方法训练并得到第i个子学习机,并计算它的均方根误差RMSEi;步骤3.5:设置i=i+1;如...

【专利技术属性】
技术研发人员:徐子睿黄灿明王丹敬王显鹏
申请(专利权)人:东北大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1