基于Stacking集成框架的光谱特征变量选择与优化方法技术

技术编号：23085771 阅读：46 留言：0更新日期：2020-01-11 01:23

本发明专利技术公开了基于Stacking集成框架的光谱特征变量选择与优化方法，包括构建样本集，将样本集分为训练样本集和测试样本集；在变量区间选择法、变量信息选择法、变量优化选择法大类中选出具有代表性的特征变量选择方法；构建多个基学习器，采用Stacking集成框架将基学习器集成，构建元学习器，将基学习器的输出作为元学习器的输入；利用样本集对Stacking集成框架的基学习器和元学习器进行训练与测试；将待检测光谱信息输入基学习器，依据元学习器的输出得到待检测光谱的检测结果。本发明专利技术的基于Stacking集成框架的光谱特征变量选择与优化方法克服了单一特征变量选择方法的缺陷，对测试样本的检测精度高，检测结果稳定性好。

Selection and optimization of spectral feature variables based on stacking integrated framework

全部详细技术资料下载

【技术实现步骤摘要】
基于Stacking集成框架的光谱特征变量选择与优化方法
本专利技术属于光谱分析领域，具体涉及基于Stacking集成框架的光谱特征变量选择与优化方法。
技术介绍
近红外光谱NIR(NearInfrared)区按美国试验和材料检测协会定义是指波长在780～2526nm范围内的电磁波。属于分子振动光谱的倍频和主频吸收光谱，近红外光谱主要是由于分子振动的非谐振性使分子振动从基态向高能级跃迁时产生的。而近红外光谱区与有机分子中含氢基团(O-H、N-H、C-H)振动的合频和各级倍频的吸收区一致，包含了大多数类型有机化合物的组成和分子结构的信息。因此，近红外光谱分析技术可用于多种有机物的定性分析和定量分析。NIR是近几十年来发展迅速的高新分析技术之一。目前大约有50多个国家和地区开展了NIR的研究和应用工作，特别是一些发达国家表现得尤为突出，这些国家拥有大量的各种类型的NIR分析仪器用于各行各业。这些仪器在农业、石化、制药、食品等领域都得到很好应用，并取得极好的社会和经济效益。近红外光谱数据具有很高的空间复杂度，数据还包含了背景噪声、仪器误差、人为误差，以及非待测成分的信息等干扰因素。正是由于光谱分析技术面临着信息重叠、相关性、复杂性等问题，因此，对光谱特征变量选择的研究尤为必要，是当前的一个研究热点。近年来，国内外众多学者对特征选择问题进行了研究，在多元校正分析中的波长选择方法主要有相关系数法、方差分析法、逐步回归法、无信息变量的消除法、间隔偏最小二乘法、粒子群算法等。现阶段常用的光谱特征变量选择方法...

【技术保护点】
1.基于Stacking集成框架的光谱特征变量选择与优化方法，其特征在于，包括以下步骤，/n步骤1：构建样本集，将样本集分为训练样本集和测试样本集；/n步骤2：在变量区间选择法、变量信息选择法、变量优化选择法大类中选出具有代表性的特征变量选择方法；/n步骤3：利用步骤2选出的特征变量选择方法构建多个基学习器，采用Stacking集成框架将基学习器集成，构建元学习器，将基学习器的输出作为元学习器的输入；/n步骤4：利用样本集对Stacking集成框架的基学习器和元学习器进行训练与测试；/n步骤4.1：采用训练样本集对Stacking集成框架的基学习器和元学习器进行训练；/n步骤4.2：采用测试样本集对Stacking集成框架的基学习器和元学习器进行测试；/n步骤5：将待检测光谱信息输入基学习器，依据元学习器的输出得到待检测光谱的检测结果。/n

【技术特征摘要】
1.基于Stacking集成框架的光谱特征变量选择与优化方法，其特征在于，包括以下步骤，
步骤1：构建样本集，将样本集分为训练样本集和测试样本集；
步骤2：在变量区间选择法、变量信息选择法、变量优化选择法大类中选出具有代表性的特征变量选择方法；
步骤3：利用步骤2选出的特征变量选择方法构建多个基学习器，采用Stacking集成框架将基学习器集成，构建元学习器，将基学习器的输出作为元学习器的输入；
步骤4：利用样本集对Stacking集成框架的基学习器和元学习器进行训练与测试；
步骤4.1：采用训练样本集对Stacking集成框架的基学习器和元学习器进行训练；
步骤4.2：采用测试样本集对Stacking集成框架的基学习器和元学习器进行测试；
步骤5：将待检测光谱信息输入基学习器，依据元学习器的输出得到待检测光谱的检测结果。

2.根据权利要求1所述的基于Stacking集成框架的光谱特征变量选择与优化方法，其特征在于，步骤1中，所述构建样本集，配置预定浓度范围的乙醇样本多个，获取各样本12000～4000cm-1波数范围内的近红外光谱信息，将样本按比例分成训练样本集和测试样本集。

3.基于Stacking集成框架的光谱特征变量选择与优化方法，其特征在于，所述样本集或待检测光谱信息输入基学习器前，采用标准正态变量变换法对样本集或待检测光谱信息进行预处理。

4.根据权利要求1所述的基于Stacking集成框架的光谱特征变量选择与优化方法，其特征在于，步骤2中，所述选出具有代表性的特征变量选择方法，选出的特征变量选择方法包括协同间隔偏最小二乘法、无信息变量的消除法、粒子群算法。

5.根据权利要求1所述的基于Stacking集成框架的光谱特征变量选择与优化方法，其特征在于，步骤3中，所述元学习器采用非线性的支持向量回归方法。

6.根据权利要求4所述的基于Stacking集成框架的光谱特征变量选择与优化方法，其特征在于，所述协同间隔偏最小二乘法的参数划分为20个区间。

7.根据权利要求4所述的基于Stacking集成框架的光谱特征变量选择与优化方法，其特征在于，所述粒子群算法利用遗传算法进行优化，遗传算法优化粒子群算法的方法包括以下步骤：
1)对一群粒子的位置以及速度进行初始化，使它们分散在整个解空间中；第i个粒子表示第i个光谱向量xi＝(xi1,xi2,…,xim)，第i个粒子位置变化速度vi＝(vi1,vi2,…,vim)；
2)根据适应度函数计算每一个粒子的适应度；对每个粒子的位置对应的变量采用偏最小二乘回归法建模，并采用十折交叉验证确定偏最小二乘回归法建模的最佳主成分数，将训练集的均方根误差作为适应度值；
3)将每一个粒子的适应度值和这一粒子的历史最优位置相比较，如果当前的适应度值比较好，则将这一...

【专利技术属性】
技术研发人员：任顺，张畅，任东，徐守志，杨信廷，马凯，张雄，陆安祥，
申请(专利权)人：三峡大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人