基于改进梯度提升决策树的卷烟空头率预测方法及系统技术方案

技术编号:22135872 阅读:27 留言:0更新日期:2019-09-18 09:29
本发明专利技术公开一种基于改进梯度提升决策树的卷烟空头率预测方法,包括以下步骤:获取相同批次烟丝在制丝的各个工序下的工艺参数以及最终卷包工序下的空头率数据,将工艺参数及空头率数据组成原始数据集;基于原始数据集结合相关系数分析法对原始数据集进行划分,得到关键工艺参数集;对所述关键工艺参数集中的数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;基于训练数据集中的训练样本,进而构建改进梯度提升决策树模型;将测试数据集样本输入至改进梯度提升决策树模型,对卷烟空头率进行预测。将制丝过程的各工序参数与卷包空头率指标之间建立联系,实现了对卷烟空头率更加精准的预测。

Prediction Method and System of Cigarette Short End Rate Based on Improved Gradient Lifting Decision Tree

【技术实现步骤摘要】
基于改进梯度提升决策树的卷烟空头率预测方法及系统
本专利技术涉及卷烟空头率预测
,尤其涉及一种基于改进梯度提升决策树的卷烟空头率预测方法及系统。
技术介绍
卷接工序是卷烟加工中的一个重要环节,其工艺优劣直接影响烟丝的质量和品质。然而,在实际生产过程中总是不可避免地会出现卷烟空头情况,造成原辅料以及效率的浪费;目前,解决卷烟空头问题的主要方法是对卷烟机自身改进和对制丝过程工艺研究的尝试,但这些方式仅能以小批量实验的形式开展,获得数据量较少,以至于无法发现更多的规律和更优的参数标准,不能达到期望的优化效果。因此,有必要采用一种新的方法来探索、挖掘制丝过程中的诸多工艺参数与卷烟空头率之间的内在关系,提前预测卷烟工序的空头率,并尽早发现卷烟空头率的变化趋势。常见的预测方法主要包括基于统计回归的预测方法和基于机器学习的预测方法。基于统计回归的预测方法有指数平滑法、ARMIA等。由于卷烟生产过程工艺参数较多,基于统计回归的预测方法运算时间较长,且在拟合数学模型的过程中往往会遗漏某些重要工艺参数,导致预测精度较差。而基于机器学习的预测方法主要包括神经网络、K近邻算法等,传统BP神经网络模型在预测方面的应用研究已取得了较大的发展,但由于神经网络模型是一个黑箱过程,模型解释性不强,存在收敛速度较慢、泛化能力差等缺点,无法达到满意的预测结果。
技术实现思路
本专利技术针对现有技术中的缺点,提供了一种基于改进梯度提升决策树的卷烟空头率预测方法及系统。为了解决上述技术问题,本专利技术通过下述技术方案得以解决:一种基于改进梯度提升决策树的卷烟空头率预测方法,包括以下步骤:获取相同批次烟丝在制丝的各个工序下的工艺参数以及最终卷包工序下的空头率数据,将工艺参数及空头率数据组成原始数据集;基于原始数据集结合相关系数分析法对原始数据集进行划分,确定关键工艺参数,得到关键工艺参数集;对所述关键工艺参数集中的数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;基于训练数据集中的训练样本,通过迭代算法建立相应的回归决策树模型,进而构建改进梯度提升决策树模型;将测试数据集样本输入至改进梯度提升决策树模型,对卷烟空头率进行预测。作为一种可实施方式,所述将训练集样本输入至改进梯度提升决策树模型,对卷烟空头率进行预测步骤之前,还包括优化迭代步骤,所述优化迭代步骤具体为:采用交叉验证法对改进梯度提升决策树模型的模型参数进行选取,得到优化后的改进梯度提升决策树模型。作为一种可实施方式,所述对所述关键工艺参数集中的数据进行归一化处理,具体为:zk=(Dk-Dk,min)/(Dk,max-Dk,min)其中,zk为归一化后的数据;Dk为归一化前实测数据;Dk,min为参数中的最小值,Dk,max为参数中的最大值。作为一种可实施方式,所述基于训练数据集中的训练样本,通过迭代算法建立相应的回归决策树模型,进而构建改进梯度提升决策树模型,具体为:基于训练数据集,建立回归树模型,将训练数据集记作其中,x表示输入变量,y表示相对应的输出变量,假设每棵回归树的叶子为Jm,将输入空间划分为Jm个不相交区域:R1m,R2m,L,Rjm,并在每个区域上确定输出的常量值,假设bjm为区域Rjm的常量值,则回归树模型表达式为:其中,R1m,R2m,L,Rjm表示Jm个不相交区域,I表示区域判断输出表达式,gm(x)表示回归树模型;通过Huber损失函数对建立好的回归树模型进行初始化,得到初始化后的回归树模型,并对初始化后的回归树模型进行训练,初始化后的回归树模型表示为:其中,N表示数量,L表示损失函数,x表示输入变量,y表示相对应的输出变量,f(x)表示一个拟合函数;对初始化后的回归树模型进行训练,得到回归树模型的梯度下降的步长;基于确立好的梯度下降的步长,对初始化后的回归树模型进行更新,更新后的回归树模型表示为:fm(x)=fm-1(x)+lr*βmgm(x)其中,lr表示学习率,x表示输入变量,βm表示梯度下降的步长,gm(x)表示回归树模型,fm(x)表示更新后的回归树模型,fm-1(x)表示更新前的回归树模型;基于最小化损失函数的期望值对更新后的回归树模型进行不断更新,最终输出稳定的改进梯度提升决策树模型。作为一种可实施方式,所述对初始化后的回归树模型进行训练,得到回归树模型的梯度步长,具体为:迭代生成M棵回归树,m∈[1,M],m表示第m棵树;将样本数据集中的数据记作N,i∈[1,N],i表示第i个样本,获得损失函数的负梯度值,并将所述负梯度值作为残差的估计值rim,残差的估计值表示如下:其中,fm-1(xi)表示m-1棵树的第i个样本所对应的回归树模型,yi表示第i个样本所对应的输出变量;基于产生的残差生成一棵回归树模型gm(x)将第m棵树的输入空间分割成J个不相交区域:R1m,R2m,L,Rjm,计算梯度下降的步长,梯度下降的步长表示为:式中,βm表示梯度下降的步长,β是通过线性搜索法确定的步长。一种基于改进梯度提升决策树的卷烟空头率预测系统,包括数据获取模块、预处理模块、再处理模块、模型训练模块和预测模块;所述数据获取模块,用于获取相同批次烟丝在制丝的各个工序下的工艺参数以及最终卷包工序下的空头率数据,将工艺参数及空头率数据组成原始数据集;所述预处理模块,用于基于原始数据集结合相关系数分析法对原始数据集进行划分,确定关键工艺参数,得到关键工艺参数集;所述再处理模块,用于对所述关键工艺参数集中的数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;所述模型训练模块,用于基于训练数据集中的训练样本,通过迭代算法建立相应的回归决策树模型,进而构建改进梯度提升决策树模型;所述预测模块,用于将测试数据集样本输入至改进梯度提升决策树模型,对卷烟空头率进行预测。作为一种可实施方式,还包括优化模型,所述优化模块用于采用交叉验证法对改进梯度提升决策树模型的模型参数进行选取,得到优化后的改进梯度提升决策树模型。作为一种可实施方式,所述再处理模块被设置为:zk=(Dk-Dk,min)/(Dk,max-Dk,min)其中,zk为归一化后的数据;Dk为归一化前实测数据;Dk,min为参数中的最小值,Dk,max为参数中的最大值。作为一种可实施方式,所述模型训练模块被设置为:基于训练数据集,建立回归树模型,将训练数据集记作其中,x表示输入变量,y表示相对应的输出变量,假设每棵回归树的叶子为Jm,将输入空间划分为Jm个不相交区域:R1m,R2m,L,Rjm,并在每个区域上确定输出的常量值,假设bjm为区域Rjm的常量值,则回归树模型表达式为:其中,R1m,R2m,L,Rjm表示Jm个不相交区域,I表示区域判断输出表达式,gm(x)表示回归树模型;通过Huber损失函数对建立好的回归树模型进行初始化,得到初始化后的回归树模型,并对初始化后的回归树模型进行训练,初始化后的回归树模型表示为:其中,N表示数量,L表示损失函数,x表示输入变量,y表示相对应的输出变量,f(x)表示一个拟合函数;对初始化后的回归树模型进行训练,得到回归树模型的梯度下降的步长;基于确立好的梯度下降的步长,对初始化后的回归树模型进行更新,更新后的回归树模型本文档来自技高网...

【技术保护点】
1.一种基于改进梯度提升决策树的卷烟空头率预测方法,其特征在于,包括以下步骤:获取相同批次烟丝在制丝的各个工序下的工艺参数以及最终卷包工序下的空头率数据,将工艺参数及空头率数据组成原始数据集;基于原始数据集结合相关系数分析法对原始数据集进行划分,确定关键工艺参数,得到关键工艺参数集;对所述关键工艺参数集中的数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;基于训练数据集中的训练样本,通过迭代算法建立相应的回归决策树模型,进而构建改进梯度提升决策树模型;将测试数据集样本输入至改进梯度提升决策树模型,对卷烟空头率进行预测。

【技术特征摘要】
1.一种基于改进梯度提升决策树的卷烟空头率预测方法,其特征在于,包括以下步骤:获取相同批次烟丝在制丝的各个工序下的工艺参数以及最终卷包工序下的空头率数据,将工艺参数及空头率数据组成原始数据集;基于原始数据集结合相关系数分析法对原始数据集进行划分,确定关键工艺参数,得到关键工艺参数集;对所述关键工艺参数集中的数据进行归一化处理,通过对归一化处理后的数据进行随机划分,得到训练数据集和测试数据集;基于训练数据集中的训练样本,通过迭代算法建立相应的回归决策树模型,进而构建改进梯度提升决策树模型;将测试数据集样本输入至改进梯度提升决策树模型,对卷烟空头率进行预测。2.根据权利要求1所述的基于改进梯度提升决策树的卷烟空头率预测方法,其特征在于,所述将训练集样本输入至改进梯度提升决策树模型,对卷烟空头率进行预测步骤之前,还包括优化迭代步骤,所述优化迭代步骤具体为:采用交叉验证法对改进梯度提升决策树模型的模型参数进行选取,得到优化后的改进梯度提升决策树模型。3.根据权利要求1所述的基于改进梯度提升决策树的卷烟空头率预测方法,其特征在于,所述对所述关键工艺参数集中的数据进行归一化处理,具体为:zk=(Dk-Dk,min)/(Dk,max-Dk,min)其中,zk为归一化后的数据;Dk为归一化前实测数据;Dk,min为参数中的最小值,Dk,max为参数中的最大值。4.根据权利要求1所述的基于改进梯度提升决策树的卷烟空头率预测方法,其特征在于,所述基于训练数据集中的训练样本,通过迭代算法建立相应的回归决策树模型,进而构建改进梯度提升决策树模型,具体为:基于训练数据集,建立回归树模型,将训练数据集记作其中,x表示输入变量,y表示相对应的输出变量,假设每棵回归树的叶子为Jm,将输入空间划分为Jm个不相交区域:R1m,R2m,L,Rjm,并在每个区域上确定输出的常量值,假设bjm为区域Rjm的常量值,则回归树模型表达式为:其中,R1m,R2m,L,Rjm表示Jm个不相交区域,I表示区域判断输出表达式,gm(x)表示回归树模型;通过Huber损失函数对建立好的回归树模型进行初始化,得到初始化后的回归树模型,并对初始化后的回归树模型进行训练,初始化后的回归树模型表示为:其中,N表示数量,L表示损失函数,x表示输入变量,y表示相对应的输出变量,f(x)表示拟合函数;对初始化后的回归树模型进行训练,得到回归树模型的梯度下降的步长;基于确立好的梯度下降的步长,对初始化后的回归树模型进行更新,更新后的回归树模型表示为:fm(x)=fm-1(x)+lr*βmgm(x)其中,lr表示学习率,x表示输入变量,βm表示梯度下降的步长,gm(x)表示回归树模型,fm(x)表示更新后的回归树模型,fm-1(x)表示更新前的回归树模型;基于最小化损失函数的期望值对更新后的回归树模型进行不断更新,最终输出稳定的改进梯度提升决策树模型。5.根据权利要求4所述的基于改进梯度提升决策树的卷烟空头率预测方法,其特征在于,所述对初始化后的回归树模型进行训练,得到回归树模型的梯度步长,具体为:迭代生成M棵回归树,m∈[1,M],m表示第m棵树;将样本数据集中的数据记作N,i∈[1,N],i表示第i个样本,获得损失函数的负梯度值,并将所述负梯度值作为残差的估计值rim,残差的估计值表示如下:其中,fm-1(xi)表示m-1棵树的第i个样本所对应的回归树模型,yi表示第i个样本所对应的输出变量;基于产生的残差生成一棵回归树模型gm(x)将第m棵树的输入空间分割成J个不相交区域:R1m,R2m,L,Rjm,计算梯度下降的步长,梯度下降的步长表示为:其中,βm表示梯...

【专利技术属性】
技术研发人员:潘凡易永余张开桓徐剑楼阳冰吴芳基
申请(专利权)人:杭州安脉盛智能技术有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1