基于随机森林的松散回潮加水比例的预测方法技术

技术编号:26378840 阅读:35 留言:0更新日期:2020-11-19 23:47
本发明专利技术公开了一种基于随机森林的松散回潮加水比例的预测方法,是首先对烟草制丝工艺数据进行数据清洗、数据集成、数据规约等处理并划分训练集和测试集;其次利用训练集数据对模型进行训练,进行数据评估和对比分析,选择有较高的性能的模型进行最终模型构建;再次在随机森林模型中特征贡献方面进行充分的分析,并进行排序;然后在松散回潮烟丝含水量因素评估方面,进行分析评估并得出结论;接着在润叶加料烟丝含水率因素评估方面得出的分析与结论;最后随机森林松散回潮加水量预测与建模特征重要性排序的分析与结论。本发明专利技术能克服随机森林在多批次、时序特征环境下的模型缺陷,可实时精准预测多批次、连续生产环境下的加水比率。

【技术实现步骤摘要】
基于随机森林的松散回潮加水比例的预测方法
本专利技术属于烟草制丝工艺领域,尤其涉及基于随机森林,多批次连续生产环境下的松散回潮加水比例预测方法。
技术介绍
近年来,我国的经济飞速发展,带动的不仅是人们生活水平的提高,人们对生活质量的要求也逐渐升高。人们越来越追求高质量、高水平的产品。而烟草行业是一个竞争非常激烈的行业,客户对烟草质量存在越来越高的要求,因此,提高烟草质量是保障企业效益的重要步骤。近几年,随机森林在很多应用场景中有了显著的效果。随机森林有很多优点,例如可以产生高准确度的分类器,可以处理大量的输入变数,对不平衡的分类资料集来说,它可以平衡误差。本次采用随机森林来进行预测。制丝是烟草生产中最为关键的步骤,制丝过程能够体现烟丝的感官风格、烟丝质量等烟丝基本特质。然而制丝是个复杂繁琐的过程,如图1所示,在这个过程中,加工环境、工厂气候、工艺手段以及制作设备都会对烟丝的质量与品质产生直接影响。制丝过程一般可以分为切片、松散回潮、润叶加料、切丝、烘丝以及加香等五个步骤,每个步骤对烟丝的口感、质量与风格均有影响。各个步骤之间承上本文档来自技高网...

【技术保护点】
1.一种基于随机森林的松散回潮加水比例的预测方法,其特征在于,包括以下步骤:/nS1:对实验数据的处理,包括数据清洗、数据集成、数据规约,并对预处理后的实验数据进行分类标签,得到规范后的标签数据集,并划分训练集和测试集;/nS2:选择三种机器学习模型进行实验,并对三种机器学习模型的结果进行数据评估和对比分析,选择有较高的性能的模型模型用于最终模型构建;/nS3:计算随机森林模型中特征贡献情况;/nS4:评估松散回潮烟丝含水量因素;/nS5:评估润叶加料烟丝含水率因素;/nS6:基于随机森林的松散回潮加水量的预测与特征重要性排序。/n

【技术特征摘要】
1.一种基于随机森林的松散回潮加水比例的预测方法,其特征在于,包括以下步骤:
S1:对实验数据的处理,包括数据清洗、数据集成、数据规约,并对预处理后的实验数据进行分类标签,得到规范后的标签数据集,并划分训练集和测试集;
S2:选择三种机器学习模型进行实验,并对三种机器学习模型的结果进行数据评估和对比分析,选择有较高的性能的模型模型用于最终模型构建;
S3:计算随机森林模型中特征贡献情况;
S4:评估松散回潮烟丝含水量因素;
S5:评估润叶加料烟丝含水率因素;
S6:基于随机森林的松散回潮加水量的预测与特征重要性排序。


2.根据权利要求1所述的基于随机森林的松散回潮加水比例的预测方法,其特征在于,所述S2是按如下步骤进行:
S2.1定义最大迭代次数为T,当前迭代次数为t;
S2.2对所述训练集进行第t次随机采样,共采集m次,得到第t次随机采样的包含m个样本的采样集Dt;
S2.3基于第t次随机采样的采样集Dt训练第t个决策树模型Gt(x),并在随机选择的样本特征中选择一个最优的特征作为决策树的左右子树划分依据;
S2.3将t+1赋值给t后,判断t>T是否成立,若成立,则表示完成T个决策树模型的训练,并对T个决策树模型得到的回归结果求平均,从而得到平均值作为最终的强分类器的输出f(x);否则,返回S2.2。


3.根据权利要求1所述的基于随机森林的松散回潮加水比例预测方法,其特征在于,所述S3是通过实验分析制丝过程中各个环节的工艺参数对研究结果的影响,并将随机森林模型输出的特征贡献进行排序;从而得到润叶加料环境温度对模型的贡献最大。

【专利技术属性】
技术研发人员:薛训明李国龙汪飞许默为李亚张超韩旭徐秀
申请(专利权)人:安徽中烟工业有限责任公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1