当前位置: 首页 > 专利查询>东北大学专利>正文

一种基于梯度提升树模型的热连轧带钢凸度预测方法技术

技术编号:23605093 阅读:44 留言:0更新日期:2020-03-28 06:05
本发明专利技术的一种基于梯度提升树模型的热连轧带钢凸度预测方法,包括:选择相关热轧带钢的工艺参数、设备参数和带钢参数与实际带钢凸度作为热连轧带钢凸度预测模型的输入与输出;在热轧带钢生产现场收集相关原始建模数据并进行预处理,通过去除缺失值、异常值和数据均衡获得最终建模数据;按照一定比例将通过预处理获得的最终建模数据划分为训练数据集和测试数据集;基于训练数据集,用交叉验证建立基于梯度提升树算法的热连轧带钢凸度预测模型;采用坐标下降法确定热连轧带钢凸度预测模型的最优参数;基于测试数据集评价所建立的热连轧带钢凸度预测模型的性能。本发明专利技术可以精确的预测热连轧带钢的凸度,有助于改善热连轧带钢的大凸度偏差问题。

A prediction method of strip crown based on gradient lifting tree model

【技术实现步骤摘要】
一种基于梯度提升树模型的热连轧带钢凸度预测方法
本专利技术属于工程与人工智能
,涉及一种基于梯度提升树模型的热连轧带钢凸度预测方法。
技术介绍
随着制造业的迅速发展,对优质带钢的需求也在不断增加。热轧带钢的质量指标不仅包括机械性能,还包括几何外观参数。凸度作为带钢非常重要的几何外观参数之一被用于评价带钢的横截面形状。作为许多工业产品的一种主要原材料,极大的热轧带钢凸度偏差将严重影响工业产品的质量,因此,明确热轧带钢凸度的变化规律一直是本领域的研究重点。带钢凸度受轧辊弹性变形、轧辊磨削凸度、轧辊热膨胀、轧辊磨损、带钢力学性能与几何尺寸等因素的影响,因此,带钢凸度的控制精度直接取决于上述因素的计算精度。传统理论方法,包括解析法、影响函数法、有限元法和有限差分法等传统方法已被采用来建立高精度的轧辊变形、热凸度、磨损凸度与带钢变形计算模型。虽然基于传统方法的计算模型已被广泛接受与应用,但由于热轧环境复杂和传统方法本身的局限性(存在条件简化与假设),很难进一步提高带钢凸度的控制精度。
技术实现思路
为解决上述技术问题,本专利技术的目的是提供一种基于梯度提升树模型的热连轧带钢凸度预测方法,基于大量实际带钢生产数据和梯度提升树算法建立了高精度热轧带钢凸度预测模型,以改善热轧带钢存在的大凸度偏差问题。本专利技术提供一种基于梯度提升树模型的热连轧带钢凸度预测方法,包括如下步骤:步骤1:选择相关热轧带钢的工艺参数、设备参数和带钢参数与实际带钢凸度作为建立热连轧带钢凸度预测模型的输入与输出;>步骤2:在热轧带钢生产现场收集相关原始建模数据并进行预处理,通过去除缺失值、异常值和数据均衡获得最终建模数据;步骤3:按照一定比例将通过预处理获得的最终建模数据随机划分为训练数据集和测试数据集;步骤4:基于训练数据集,采用交叉验证建立基于梯度提升树算法的热连轧带钢凸度预测模型;步骤5:采用坐标下降法确定基于梯度提升树算法的热连轧带钢凸度预测模型的最优参数;步骤6:基于测试数据集,采用决定系数、平均绝对误差、平均绝对百分误差和均方根误差来评价按照上述步骤建立的基于梯度提升树算法的热连轧带钢凸度预测模型的性能。在本专利技术的基于梯度提升树模型的热连轧带钢凸度预测方法中,所述步骤2具体为:步骤2.1:检查所收集的每一个带钢数据样本是否存在缺失值,如果某一个带钢数据样本存在缺失值,则去除该带钢数据样本;步骤2.2:将所有变量按照是否与带钢种类有关分为A类与B类,A类变量与带钢种类有关,B类变量与带钢种类无关;步骤2.3:基于拉依达准则去除含有B类变量的异常值的每个带钢数据样本;步骤2.4:根据带钢化学成分,尺寸规格将余下的带钢数据样本分成M个类别(C1,…,CJ,…,CM);步骤2.5:判断类别CJ中的带钢数据样本数是否超过30,如果带钢数据样本数超过30,基于拉依达准则去除含有A类变量的异常值的每个带钢数据样本;如果带钢数据样本数小于30,基于格拉布斯准则去除含有A类变量的异常值的每个带钢数据样本;步骤2.6:去除采样极不均衡的带钢数据样本获得最终建模带钢数据。在本专利技术的基于梯度提升树模型的热连轧带钢凸度预测方法中,所述步骤2.3中的拉依达准则判别式为:其中,是变量E的极值,是变量E的平均值,σ是变量E的方差;判断变量E的极值是否满足式(1),如果满足式(1)则为变量E中的异常值,去除该带钢数据样本;当变量E的极值不满足式(1),则变量E中的异常值已全部去除,按照该方法去除含有B类变量的异常值的带钢数据样本。在本专利技术的基于梯度提升树模型的热连轧带钢凸度预测方法中,所述步骤2.5中格拉布斯准则通过对比计算所得的G值与临界G(n,α)值的大小来判断异常值,其中α为显著水平,G值计算公式为:其中,n是变量F的取值数量,是变量F的第q个值,是变量F的平均值,σ是变量F的方差;如果变量F的计算G值大于临界G(n,α)值,则为变量F的异常值,去除该带钢数据样本;当变量F的计算G值小于临界G(n,α)值,则变量F中无异常值,基于格拉布斯准则去除带钢数据样本数小于30的类别中含有A类变量的异常值的带钢样本。在本专利技术的基于梯度提升树模型的热连轧带钢凸度预测方法中,所述步骤4具体为:步骤4.1:带钢训练数据集包含N个样本,记作D={(x1,y1),...,(xi,yi),...,(xN,yN)},每个样本包含P个输入变量,记作与一个输出变量为带钢实际凸度,记作yi;步骤4.2:利用k折交叉验证将训练数据集划分成k个互斥子集,k-1个子集被用作训练数据,余下一个子集被用作验证数据,在每个训练过程中,总计得到k组训练和验证数据来训练热连轧带钢凸度的预测模型;步骤4.3:基于梯度提升树算法的热连轧带钢凸度预测模型表达为:其中,hm(x)是梯度提升树模型中的第m棵回归树;Z是所有回归树的函数空间;εm是步长;NGBDT是回归树数量;步骤4.4:将基于梯度提升树算法的热连轧带钢凸度预测模型表达式改写为加法模型:fm(x)=fm-1(x)+εmhm(x)(4)其中,fm-1(x)是由m-1棵回归树构成的带钢凸度预测模型;fm(x)是在现有的m-1棵回归树中加入一棵新的回归树而得到的带钢凸度预测模型;步骤4.5:通过最小化损失函数L来构建新的回归树hm(x):步骤4.6:在损失函数的负梯度方向搜索最小损失函数以构建新的回归树,进而建立新的凸度预测模型:其中,步长εm通过线性搜索得到:步骤4.7:在模型训练过程中,均方根误差的平均值MRMSE、均方根误差的方差SRMSE、决定系数平均值MR2、决定系数的方差SR2被用于评价用k组验证数据的预测结果。在本专利技术的基于梯度提升树模型的热连轧带钢凸度预测方法中,所述步骤5中的最优参数包括:回归树的数量NGBDT、学习率R、回归树的最大深度MaxGBDTD、回归树节点分裂所需的最小样本数MinGBDTS、回归树叶节点的最小样本数MinGBDTL、判断回归树节点分裂所涉及的最大特征数MaxGBDTF和子采样率SGBDT。在本专利技术的基于梯度提升树模型的热连轧带钢凸度预测方法中,所述步骤5具体为:步骤5.1:首先采用坐标下降法依次初步调节SGBDT、MaxGBDTF、MinGBDTL、MinGBDTS、MaxGBDTD,确定这些参数初始值;当某个参数的最优值被确定,则该参数的最优值将替换其初始值用于其他参数的寻优;步骤5.2:在高学习率R=0.1~0.2下,计算得出随着NGBDT的增加用于评价带钢凸度预测模型在训练过程中的性能的MRMSE、SRMSE、MR2和SR2的变化情况,基于计算结果确定在高学习率R=0.1~0.2下的最优NGBDT和R;步骤5.3:计算得出随着MaxGBDTD和MinGBDTS的共同变化用于评价带钢凸度预测模型在本文档来自技高网...

【技术保护点】
1.一种基于梯度提升树模型的热连轧带钢凸度预测方法,其特征在于,包括如下步骤:/n步骤1:选择相关热轧带钢的工艺参数、设备参数和带钢参数与实际带钢凸度作为建立热连轧带钢凸度预测模型的输入与输出;/n步骤2:在热轧带钢生产现场收集相关原始建模数据并进行预处理,通过去除缺失值、异常值和数据均衡获得最终建模数据;/n步骤3:按照一定比例将通过预处理获得的最终建模数据随机划分为训练数据集和测试数据集;/n步骤4:基于训练数据集,采用交叉验证建立基于梯度提升树算法的热连轧带钢凸度预测模型;/n步骤5:采用坐标下降法确定基于梯度提升树算法的热连轧带钢凸度预测模型的最优参数;/n步骤6:基于测试数据集,采用决定系数、平均绝对误差、平均绝对百分误差和均方根误差来评价按照上述步骤建立的基于梯度提升树算法的热连轧带钢凸度预测模型的性能。/n

【技术特征摘要】
1.一种基于梯度提升树模型的热连轧带钢凸度预测方法,其特征在于,包括如下步骤:
步骤1:选择相关热轧带钢的工艺参数、设备参数和带钢参数与实际带钢凸度作为建立热连轧带钢凸度预测模型的输入与输出;
步骤2:在热轧带钢生产现场收集相关原始建模数据并进行预处理,通过去除缺失值、异常值和数据均衡获得最终建模数据;
步骤3:按照一定比例将通过预处理获得的最终建模数据随机划分为训练数据集和测试数据集;
步骤4:基于训练数据集,采用交叉验证建立基于梯度提升树算法的热连轧带钢凸度预测模型;
步骤5:采用坐标下降法确定基于梯度提升树算法的热连轧带钢凸度预测模型的最优参数;
步骤6:基于测试数据集,采用决定系数、平均绝对误差、平均绝对百分误差和均方根误差来评价按照上述步骤建立的基于梯度提升树算法的热连轧带钢凸度预测模型的性能。


2.如权利要求1所述的基于梯度提升树模型的热连轧带钢凸度预测方法,其特征在于,所述步骤2具体为:
步骤2.1:检查所收集的每一个带钢数据样本是否存在缺失值,如果某一个带钢数据样本存在缺失值,则去除该带钢数据样本;
步骤2.2:将所有变量按照是否与带钢种类有关分为A类与B类,A类变量与带钢种类有关,B类变量与带钢种类无关;
步骤2.3:基于拉依达准则去除含有B类变量的异常值的每个带钢数据样本;
步骤2.4:根据带钢化学成分,尺寸规格将余下的带钢数据样本分成M个类别(C1,…,CJ,…,CM);
步骤2.5:判断类别CJ中的带钢数据样本数是否超过30,如果带钢数据样本数超过30,基于拉依达准则去除含有A类变量的异常值的每个带钢数据样本;如果带钢数据样本数小于30,基于格拉布斯准则去除含有A类变量的异常值的每个带钢数据样本;
步骤2.6:去除采样极不均衡的带钢数据样本获得最终建模带钢数据。


3.如权利要求1所述的基于梯度提升树模型的热连轧带钢凸度预测方法,其特征在于,所述步骤2.3中的拉依达准则判别式为:



其中,是变量E的极值,是变量E的平均值,σ是变量E的方差;
判断变量E的极值是否满足式(1),如果满足式(1)则为变量E中的异常值,去除该带钢数据样本;当变量E的极值不满足式(1),则变量E中的异常值已全部去除,按照该方法去除含有B类变量的异常值的带钢数据样本。


4.如权利要求1所述的基于梯度提升树模型的热连轧带钢凸度预测方法,其特征在于,所述步骤2.5中格拉布斯准则通过对比计算所得的G值与临界G(n,α)值的大小来判断异常值,其中α为显著水平,G值计算公式为:



其中,n是变量F的取值数量,是变量F的第q个值,是变量F的平均值,σ是变量F的方差;
如果变量F的计算G值大于临界G(n,α)值,则为变量F的异常值,去除该带钢数据样本;当变量F的计算G值小于临界G(n,α)值,则变量F中无异常值,基于格拉布斯准则去除带钢数据样本数小于30的类别中含有A类变量的异常值的带钢样本。


5.如权利要求1所述的基于梯度提升树模型的热连轧带钢凸度预测方法,其特征在于,所述步骤4具体为:
步骤4.1:带钢训练数据集包含N个样本,记作D={(x1,y1),...,(xi,yi),...,(xN,yN)},每个样本包含P个输入变量,记作与一个输出变量为带钢实际凸度,记作yi;
步骤4.2:利用k折交叉验证将训练数据集划分成k个互斥子集,k-1个子集被用作训练数据,余下一个子集被用作验证数据,在每个训练过程中,总计得到k组训练和验...

【专利技术属性】
技术研发人员:李广焘龚殿尧鲁兴王振华张殿华徐建忠邸洪双
申请(专利权)人:东北大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1