基于随机森林迁移学习的红外光谱模型传递方法技术

技术编号：15618554 阅读：81 留言：0更新日期：2017-06-14 04:01

本发明专利技术公开一种基于随机森林迁移学习的红外光谱模型传递方法，利用随机森林思想将主仪器扫描的样本数据集利用Bootstrap方法生成多个子数据集；针对每个子数据集，结合目标仪器扫描的样本数据集，利用迁移学习算法建立目标仪器上的分析模型；针对目标仪器上采集的待测样本红外光谱，根据建立的每个分析模型预测其待测组分含量；计算每个待测样本与建立的各个分析模型中样本之间的结构分布相似度，以确定与每个待测样本对应的各个目标分析模型权重因子；再利用加权平均方法对预测结果进行汇总，得到最终的待测组分含量。该方法具备鲁棒性强、自适应的优点，有效提升模型传递的准确度和稳定性，可以广泛应用于固相、液相和气相的红外光谱模型传递领域中。

全部详细技术资料下载

【技术实现步骤摘要】
基于随机森林迁移学习的红外光谱模型传递方法
本专利技术涉及一种基于随机森林迁移学习的红外光谱模型传递方法,适用于不同厂家、不同型号红外光谱仪的跨平台模型通用方法。
技术介绍
红外光谱分析是一种新兴的分析技术，由于它具有快速、无损和无污染等优点，在农业、化工和环境监测等领域有着广泛的应用。红外光谱分析技术要求红外光谱仪和定性/定量分析模型必须协调工作，否则均会对分析结果由影响。然而，在实际的应用过程中，通常会存在红外光谱仪生产厂家不同、型号不同等情况，致使所建立的分析模型无法适用于所有红外光谱仪，而为每台设备单独建立一个分析模型，则会花费大量的人力物力和时间。传统的模型传递方法包括斜率截距法、直接校正法、分段直接校正法、Shenk’s法等。但是上述几种方法均为有标样方法，即事先准备好多个标准样本，分别在主仪器和目标仪器上对这些样本进行光谱扫描，接着利用数学方法确定两者间的映射关系。对于新的待测样本，在目标仪器上扫描光谱后，利用映射函数对其进行转换，再使用主仪器上建立的原模型进行预测。但是在实际应用中，一方面，用户通常很难将标准样本长期保存，环境的变化往往会造成样本性质变化；另一方面，由于受物理空间影响，将标准样本进行长途运输亦显得不具操作性。中国海洋大学贺英于2012年在其博士论文中提出了一种新的模型传递方法——基于集成迁移学习的近红外光谱模型传递方法，通过将迁移学习、样本相似匹配和集成学习等方法相互结合，构建了具有一定稳健性的迁移模型。但是，该方法存在以下两点不足：(1)该方法中分别利用支持向量机(SupportVectorMachine,SVM)、K近邻...
基于随机森林迁移学习的红外光谱模型传递方法

【技术保护点】
一种基于随机森林迁移学习的红外光谱模型传递方法，其特征在于：包括以下步骤：S1、将主仪器扫描采集得到的样本光谱数据集D

【技术特征摘要】
1.一种基于随机森林迁移学习的红外光谱模型传递方法，其特征在于：包括以下步骤：S1、将主仪器扫描采集得到的样本光谱数据集Dm利用Bootstrap随机抽样方法生成K个子数据集：S2、针对每个子数据集结合目标仪器上扫描得到的数据集Ds，利用迁移学习算法建立目标仪器上的红外光谱与化学组分间的映射模型：同时形成新的数据集S3、针对待测样本，利用目标仪器扫描其红外光谱xi，并将其送入到每个映射模型从而得到每个映射模型给出的化学组分预测值：S4、计算待测样本xi与数据集中每个样本的相似度，并进行累加求和，记为：Si(1≤i≤k)；S5、针对待测样本xi，计算各个映射模型对应的权重因子：S6、利用加权平均方法计算待测样本的化学组分含量：2.根据权利要求1所述的基于随机森林迁移学习的红外光谱模型传递方法，其特征在于：所述步骤S2中的迁移学习算法包括基于实例的迁移算法和基于特征的迁移算法。3.根据权利要求1所述的基于随机森林迁移学习的红外光谱模型传递方法，其特征在于：所述步骤S2中映射模型包括线性模型和非线性...

【专利技术属性】
技术研发人员：陈媛媛，李墅娜，张瑞，王志斌，景宁，
申请(专利权)人：中北大学，
类型：发明
国别省市：山西,14

全部详细技术资料下载我是这个专利的主人