一种基于随机森林分类的连铸坯夹杂预测方法技术

技术编号:27471468 阅读:21 留言:0更新日期:2021-03-02 17:37
本发明专利技术公开了一种基于随机森林分类的连铸坯夹杂预测方法,首先采集连铸生产过程中影响铸坯夹杂质量问题的影响因素数据,构建原始特征样本集;然后对原始特征样本集进行数据预处理划分为训练集和测试集,并根据训练集数据使用序列后向选择算法结合随机森林算法得到最优特征样本数据集或最优特征集合;之后使用遗传算法对随机森林算法参数进行优化获取最优随机森林分类预测模型;S4:最后进行连铸坯夹杂预测。较于统计学方法、专家系统、支持向量机、BP神经网络等连铸坯夹杂预测模型,该方法具有更高的预测精度和更快的运行速度,有利于对连铸坯质量及时和精准判定。对连铸坯质量及时和精准判定。对连铸坯质量及时和精准判定。

【技术实现步骤摘要】
一种基于随机森林分类的连铸坯夹杂预测方法


[0001]本专利技术涉及钢铁冶金
,特别是指一种基于随机森林分类的连铸坯夹杂预测方法。
[0002]
技术介绍

[0003]为适应连铸机高效率的生产过程,保证向热轧厂提供无缺陷铸坯,除采取一系列严格的工艺措施之外,还必须建立一套铸坯质量判定系统,以在线快速判定板坯可能出现的质量缺陷。在此基础上改进生产工艺,在减少铸坯质量缺陷产生的同时,可以有效提升钢厂生产效率,减少生产成本,实现增产增效。
[0004]目前,关于连铸坯质量的相关研究主要集中在控制与判定两方面。基于物理模型和冶金函数的铸坯质量控制相关研究主要从二次水冷控制、轻压下对连铸坯质量进行控制。铸坯质量判定相关研究主要包括基于物理手段的连铸坯质量判定方法和人工智能判定方法。人工智能判定方法是基于连铸生产数据采用数据挖掘技术构建质量预测模型,为连铸生产提供指导。
[0005]基于物理手段的检测判定,主要包括涡流检测法、超声检测方法、激光扫描检测法、红外检测法、CCD图像检测法。这些方法检测出的缺陷定量描述参数和缺陷种类有限,同时存在技术复杂、设备昂贵,需要大量的日常维护工作。
[0006]由于连铸坯质量与各影响因素具有不确定性和非线性关系,从连铸过程机理出发所建立的预报模型,难以描述各类因素的不确定关系。人工智能技术可以有效解决以上问题。
[0007]现已应用于钢铁领域连铸坯质量预测中的方法有BP神经网络、支持向量机、随机森林等。BP神经网络具有较好的非线性拟合能力,但使用该方法建立预测模型需要消耗大量时间,且容易陷入局部最优;支持向量机在非线性小样本数据集上预测性能较好,但是支持向量机借助二次规划来求解支持向量,在处理大样本数据集时需要计算高阶矩阵,需要耗费大量内存和运行时间。

技术实现思路

[0008]本专利技术要解决的技术问题是:提供一种基于随机森林分类的连铸坯夹杂预测方法,算法复杂度低,能够处理高维数据,能够实现快速运行,相较于统计学方法、专家系统、支持向量机、BP神经网络等连铸坯夹杂预测模型,该方法具有更高的预测精度和更快的运行速度,有利于对连铸坯质量及时和精准判定。
[0009]为解决上述技术问题,本专利技术采用如下技术方案:一种基于随机森林分类的连铸坯夹杂预测方法,其特征在于包括如下步骤:S1:首先采集连铸生产过程中影响铸坯夹杂质量问题的影响因素数据,对影响因素数据进行预处理,构建原始特征样本集;
S2:然后对原始特征样本集进行数据预处理划分为训练集和测试集,并根据训练集数据使用序列后向选择算法结合随机森林算法确定最优影响因素特征,得到最优特征样本数据集或最优特征集合;S3:之后使用遗传算法对随机森林算法参数进行优化,确定最优随机森林参数组合,获取最优随机森林分类预测模型;S4:最后进行连铸坯夹杂预测:将最优特征测试集样本数据输入最优随机森林夹杂预测模型,利用最优随机森林分类预测模型对测试集中的数据进行分类,预测连铸坯是否存在夹杂。
[0010]进一步的,上述技术方案中,步骤S1中对连铸坯夹杂质量的影响因素数据进行采集时,用于构建原始特征样本集的影响因素数据包括:钢种X1、废钢加入量X2、结晶器渣类型X3、吹氧量X4、长水口厂家X5、中包渣类型X6、断面宽度X7、配水方式X8、精炼方式X9、水表号X10、钢水节奏X11、中包吨位X12、中包温度X13、中包温度是否合格X14、最低拉速X15、平均拉速X16、最高拉速X17、中包炉序X18、铸机号X19、浇铸周期X20、罐况X21、换中包标志X22、引流次数X23、中包序号X24、炉机节奏X25、钢水重X26、浇铸量X27、坯量X28、班别X29、班次30。
[0011]进一步的,上述技术方案中,步骤S1中数据预处理方法包括据预处理方法包括空值处理、异常值处理,归一化处理:空值处理:空值即缺失值,采用平均值替换缺失值;异常值处理:对采集的工艺参数设置有效值范围,当采集的数据超出该有效值范围时,视为异常信号,直接将其删除,不予采用;归一化处理:训练前对原始特征数据集的数据采用最大最小值标准化方法进行归一化处理。
[0012]进一步的,上述技术方案中,步骤S2中确定最优特征集合的过程如下:利用随机森林K折交叉验证对原始特征数据集进行训练和测试得到平均预测准确率作为模型的评价标准;使用序列后向选择方法结合上述随机森林交叉验证得到多个特征组合下的平均预测准确率,选取平均预测准确率最高的子样本库对应的随机森林预测模型,包括以下步骤:S21:以M维原始特征数据集为输入,依次减少一个特征得到M-1个M-1维特征子集;S22:对每个特征子集进行随机森林交叉验证,得到对应的平均预测准确率;S23:删除准确率最低的特征,重新划分特征子集;S24:重复S22
-ꢀ
S23至剩余特征数为1;S25:选取平均预测准确率最高的子样本库特征最为最优特征,根据最优特征构建最优特征数据集。
[0013]进一步的,上述技术方案中,步骤S3中获取最优随机森林分类预测模型包括如下具体步骤:针对最优特征训练集,基于K折交叉验证,使用遗传算法对随机森林参数进行优化,确定随机森林决策树个数、得到H组参数组合下的模型平均预测准确率,选择平均预测准确率最高的随机森林分类模型作为最优的随机森林分类预测模型;包括以下步骤:S31:输入最优特征数据集;S32:初始化遗传算法参数;
S33:随机森林交叉验证得到平均预测准确率;S34:进行选择、交叉、变异改变随机森林参数值;S35:重复S33
-ꢀ
S34至满足迭代次数;S36:选择平均预测准确率最高的随机森林分类模型作为最优的随机森林分类预测模型。
[0014]进一步的,上述技术方案中,步骤S2、S3中将所使用数据集分成K份,轮流将其中K-1份做训练1份进行验证,K次的结果的均值作为对算法精度的估计。
[0015]进一步的,上述技术方案中,所述步骤S34中优化的随机森林参数为随机森林决策树个数、决策树分裂最大特征数。
[0016]进一步的,上述技术方案中,所述步骤S34中参数取值为整数,其中决策树个数取值范围为[50,300],决策树分裂最大特征数取值范围为[1,30]。
[0017]本专利技术的上述技术方案有益效果是:本专利技术提出一种基于随机森林分类夹杂质量预测模型可以避免BP神经网络、支持向量机连铸坯夹杂预测模型训练时间长、容易陷入局部最优的问题。首先根据连铸坯夹杂影响因素构建原始特征数据集,使用序列后向选择算法确定最优影响因素特征,使用遗传算法确定最优随机森林参数组合,最终得到最优随机森林分类预测模型,进一步提升了预测准确率和运行速度。相较于统计学方法、专家系统、支持向量机、BP神经网络等连铸坯夹杂预测模型,该方法具有更高的预测精度和更快的运行速度,有利于对连铸坯质量及时和精准判定。
[0018]附图说明
[0019]图1为本专利技术的基于随机森林分类的连铸坯夹杂质量预测方法的构成示意图;图2为最优特征集的获取流程图;图3为最优本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于随机森林分类的连铸坯夹杂预测方法,其特征在于包括如下步骤:S1:首先采集连铸生产过程中影响铸坯夹杂质量问题的影响因素数据,对影响因素数据进行预处理,构建原始特征样本集;S2:然后对原始特征样本集进行数据预处理划分为训练集和测试集,并根据训练集数据使用序列后向选择算法结合随机森林算法确定最优影响因素特征,得到最优特征样本数据集或最优特征集合;S3:之后使用遗传算法对随机森林算法参数进行优化,确定最优随机森林参数组合,获取最优随机森林分类预测模型;S4:最后进行连铸坯夹杂预测:将最优特征测试集样本数据输入最优随机森林夹杂预测模型,利用最优随机森林分类预测模型对测试集中的数据进行分类,预测连铸坯是否存在夹杂。2.根据权利要求1所述的基于随机森林分类的连铸坯夹杂预测方法,其特征在于步骤S1中对连铸坯夹杂质量的影响因素数据进行采集时,用于构建原始特征样本集的影响因素数据包括:钢种X1、废钢加入量X2、结晶器渣类型X3、吹氧量X4、长水口厂家X5、中包渣类型X6、断面宽度X7、配水方式X8、精炼方式X9、水表号X10、钢水节奏X11、中包吨位X12、中包温度X13、中包温度是否合格X14、最低拉速X15、平均拉速X16、最高拉速X17、中包炉序X18、铸机号X19、浇铸周期X20、罐况X21、换中包标志X22、引流次数X23、中包序号X24、炉机节奏X25、钢水重X26、浇铸量X27、坯量X28、班别X29、班次30。3.根据权利要求1所述的基于随机森林分类的连铸坯夹杂预测方法,其特征在于步骤S1中数据预处理方法包括据预处理方法包括空值处理、异常值处理,归一化处理:空值处理:空值即缺失值,采用平均值替换缺失值;异常值处理:对采集的工艺参数设置有效值范围,当采集的数据超出该有效值范围时,视为异常信号,直接将其删除,不予采用;归一化处理:训练前对原始特征数据集的数据采用最大最小值标准化方法进行归一化处理。4.根据权利要求1所述的基于随机森林分类的连铸坯夹杂预测方法,其特征在于步骤S2中确定最优特征集合的过程如下:利用随机森林K折交叉验证对原始特征数据集...

【专利技术属性】
技术研发人员:熊凌罗钟邱但斌斌容芷君祁思睿贺志壮程磊陈洋吴怀宇
申请(专利权)人:武汉科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1