一种基于数据挖掘的产品原料配比逆向推导方法技术

技术编号:35016076 阅读:19 留言:0更新日期:2022-09-21 15:19
本发明专利技术涉及一种基于数据挖掘的产品原料配比逆向推导方法,所述的逆向推导方法包括如下步骤:S1、将原料配比数据整理成初始结构化数据表,将初始原料配比数据先进行清洗,形成有效结构化数据表,采用主成分分析进行降维处理,得到降维结构化数据表;S2、将降维结构化数据表中增加不同产品性能字段,并清洗,得到多个最终产品性能训练数据集;S3、对最终产品性能训练数据集均采用随机森林回归算法构建产品性能预测模型;S4、通过贝叶斯优化算法结合不同产品性能预测模型优化得出预测性能最接近目标产品性能的原料配比,将该原料配比作为目标产品的原料配比。本发明专利技术实现橡胶产品原料配比的逆向推导。配比的逆向推导。配比的逆向推导。

【技术实现步骤摘要】
一种基于数据挖掘的产品原料配比逆向推导方法


[0001]本专利技术涉及一种基于数据挖掘的产品原料配比逆向推导方法,属于橡胶产品原料配比逆向推导


技术介绍

[0002]高分子材料
是一个发展极为迅速的领域,高分子材料中包含的种类非常多,例如橡胶、塑料、纤维、涂料、胶粘剂和高分子基复合材料等,高分子材料的应用也非常广泛,被普遍应用于建筑、交通运输、农业、液晶、医疗、电气电子工业等等。
[0003]高分子材料橡胶的制备过程往往会涉及到很多的工艺条件,比如原料配比、温度、时间等各种条件均会影响最终产品的性能,所以工艺优化过程中会涉及到大量的实验,需要实验人员配合开展相应的单因素试验及正交试验,从而工艺优化过程会占用大量的时间及材料。尤其对于原料配比方面的优化,会涉及到原料的种类及原料的比例等各个变量,对于使用原料种类较多的橡胶产品,更是会极大的增大实验成本,而原料配比是属于影响产品性能最关键的因素,因此对原料配比的快速优化具有重要的价值。
[0004]高分子材料中的橡胶由多种原料按一定配比合成,其中只以少部分原料作为主要原料,配比占比较大。原料的组成及配比不同,合成的材料产品的各种性能则截然不同。已知某种产品的各种性能推出合成该种产品所需的原料组成及配比传统上是依据该领域工程技术人员的经验进行尝试,但该方法耗时耗力,也无法形成经验的沉淀。
[0005]机器学习方法不同于传统高分子材料工程技术方法,不需考虑物化过程,只需从数据中学习原料与性能之间的映射关系,从而实现原料到产品的性能预测与反向推导,在其他工艺条件相同的情况下,可以给原料配比的实验优化带来较为直接的数据指导,从而提高原料配比优化效率。

技术实现思路

[0006]本专利技术针对现有技术存在的不足,提供一种基于数据挖掘的产品原料配比逆向推导方法,通过利用主成分分析、随机森林回归等机器学习算法构建橡胶产品与其原料配比之间的映射关系,进而实现橡胶产品原料配比的逆向推导,极大提升橡胶产品的研发效率。
[0007]本专利技术解决上述技术问题的技术方案如下:一种基于数据挖掘的产品原料配比逆向推导方法,所述的逆向推导方法包括如下步骤:S1、将橡胶初始原料配比数据整理成初始结构化数据表,将橡胶初始原料配比数据先进行清洗,得到无错误及重复的原料配比数据,形成有效结构化数据表,采用主成分分析对有效结构化数据表中的原料配比数据进行降维处理,得到降维结构化数据表;S2、将降维结构化数据表中增加不同产品性能字段,并进行数据清洗,得到多个最终产品性能训练数据集;S3、对每个最终产品性能训练数据集均采用随机森林回归算法构建产品性能预测模型;
S4、通过贝叶斯优化算法结合不同产品性能预测模型优化得出预测性能最接近目标产品性能的原料配比,将该原料配比作为目标产品的原料配比。
[0008]进一步的,步骤S1中,将初始结构化数据表中的橡胶初始原料配比数据先进行清洗,得到无错误及重复的原料配比数据,再整理成有效结构化数据表;对橡胶初始原料配比数据进行清洗具体包括:剔除同一原料出现多次的产品样本;剔除重复的产品样本;剔除原料配比之和不等于100%的产品样本。
[0009]进一步的,对原料配比数据进行降维处理,保留能解释总方差95%以上的主成分作为降维后的数据特征。
[0010]进一步的,有效结构化数据表中,行为产品样本,列为原料名称;有效结构化数据表中产品样本未使用到的原料类别的配比数据用0填充。
[0011]进一步的,步骤S2具体为:对降维结构化数据表的特征列后增加不同产品性能字段,得到初始产品性能训练数据集;对初始产品性能训练数据集进行清洗,剔除产品性能字段中异常值所对应的产品样本,从而得到正确的最终产品性能训练数据集。
[0012]进一步的,步骤S3中,随机森林回归算法的具体参数为:决策树个数n_estimators=200,决策树最大深度max_depth=4,最大特征数为4,内部节点再划分所需最小样本数min_samples_split=2,叶子节点最少样本数min_samples_leaf=1。
[0013]进一步的,步骤S4中,通过贝叶斯优化算法结合不同产品性能预测模型优化得出预测性能最接近目标产品性能的原料配比之前,先对产品性能数据库及目标产品性能做最大最小归一化,消除量纲影响,产品性能数据库中与目标产品性能欧式距离最小的产品即为与目标产品性能最接近的产品,贝叶斯优化算法的优化目标是使产品性能预测模型预测出的性能与目标产品性能的欧式距离最小化。
[0014]进一步的,以与目标产品性能最接近的产品的主原料配比为基准设计目标产品原料配比优化范围,目标产品的次要原料配比与性能最接近目标产品的产品一致。
[0015]进一步的,步骤S4中,使用bayes_opt工具包进行贝叶斯优化搜索,使用高斯过程作为贝叶斯优化的代理模型,使用UCB、EI或PI作为贝叶斯优化的采集函数。
[0016]贝叶斯优化中高斯过程模型的参数为:kernel=Matern(nu=2.5),alpha=1e

6,n_restarts_optimizer=5。
[0017]本专利技术的有益效果是:1、本专利技术通过利用主成分分析、随机森林回归、贝叶斯优化构建橡胶产品与原料配比之间的映射关系,实现橡胶产品原料配比的逆向推导,极大提升高橡胶的研发效率。
[0018]2、本专利技术中使用主成分分析将高维稀疏的原料配比数据进行降维,保留了大部分数据信息的同时,特征维度大大降低,有利于提高产品性能预测模型的预测精度,进而有利于提高贝叶斯优化算法优化目标橡胶产品原料配比的准确性。
[0019]3、本申请通过贝叶斯优化的方式来得到目标输出所对应的输入条件,节省了计算开销,在实验输入条件组合数量巨大以及输入条件是连续型特征的情形下,解决了穷举方法不可行的问题。
附图说明
[0020]图1为实施例中产品原料配比逆向推导流程图。
[0021]图2为实施例中目标产品原料配比逆推实验流程图。
具体实施方式
[0022]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面对本专利技术的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本专利技术。但是本专利技术能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本专利技术内涵的情况下做类似改进,因此本专利技术不受下面公开的具体实施例的限制。
[0023]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本专利技术。
[0024]如图所示,一种基于数据挖掘的产品原料配比逆向推导方法,所述的逆向推导方法为:汇总日常研发工作中积累的各种橡胶产品的原料配比数据,对原料配比数据进行清洗,得到无错误及重复的原料配比数据;具体包括:剔除同一原料出现多次的产品样本;剔除重复的产品样本;剔除原料配本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据挖掘的产品原料配比逆向推导方法,其特征在于,所述的逆向推导方法包括如下步骤:S1、将橡胶初始原料配比数据整理成初始结构化数据表,将橡胶初始原料配比数据先进行清洗,得到无错误及重复的原料配比数据,形成有效结构化数据表,采用主成分分析对有效结构化数据表中的原料配比数据进行降维处理,得到降维结构化数据表;S2、将降维结构化数据表中增加不同产品性能字段,并进行数据清洗,得到多个最终产品性能训练数据集;S3、对每个最终产品性能训练数据集均采用随机森林回归算法构建产品性能预测模型;S4、通过贝叶斯优化算法结合不同产品性能预测模型优化得出预测性能最接近目标产品性能的原料配比,将该原料配比作为目标产品的原料配比。2.根据权利要求1所述一种基于数据挖掘的产品原料配比逆向推导方法,其特征在于,步骤S1中,对原料配比数据进行清洗具体包括:剔除同一原料出现多次的产品样本;剔除重复的产品样本;剔除原料配比之和不等于100%的产品样本。3.根据权利要求1所述一种基于数据挖掘的产品原料配比逆向推导方法,其特征在于,对原料配比数据进行降维处理,保留能解释总方差95%以上的主成分作为降维后的数据特征。4.根据权利要求1所述一种基于数据挖掘的产品原料配比逆向推导方法,其特征在于,有效结构化数据表中,行为产品样本,列为原料名称;有效结构化数据表中产品样本未使用到的原料类别的配比数据用0填充。5.根据权利要求4所述一种基于数据挖掘的产品原料配比逆向推导方法,其特征在于,步骤S2具体为:对降维结构化数据表的特征列后增加不同产品性能字段,得到初始产品性能训练数据集;对初始产品性能训练数据集进行清洗,剔除产品...

【专利技术属性】
技术研发人员:柳彦宏戴开洋宋召青却立勇
申请(专利权)人:烟台国工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1