基于波段筛选的光谱加权集成校正模型的构建方法及系统技术方案

技术编号:20920337 阅读:27 留言:0更新日期:2019-04-20 10:29
本发明专利技术涉及光谱分析中的多元校正领域,具体为一种基于波段筛选的光谱加权集成校正模型的构建方法及系统,其中基于波段筛选的光谱加权集成校正模型的构建方法,包括:红外光谱波长聚类;对聚类后的红外光谱波长剪枝;根据剪枝后的红外光谱波长构建综合加权系数;根据综合加权系数构建加权集成校正模型;以及通过加权集成校正模型得到预测含量矩阵。实现了加强加权集成校正模型稳定性。

Construction method and system of spectral weighted integrated calibration model based on band selection

The invention relates to the field of multivariate calibration in spectral analysis, in particular to a method and system for constructing a spectral weighted integrated calibration model based on band selection. The method for constructing a spectral weighted integrated calibration model based on band selection includes: infrared spectrum wavelength clustering; infrared spectrum wavelength pruning after clustering; and synthesis based on the infrared spectrum wavelength after pruning. Weighted coefficients; a weighted integrated correction model is constructed based on the comprehensive weighted coefficients; and the prediction content matrix is obtained by the weighted integrated correction model. The stability of the weighted integrated correction model is enhanced.

【技术实现步骤摘要】
基于波段筛选的光谱加权集成校正模型的构建方法及系统
本专利技术涉及光谱分析中的多元校正领域,具体为一种基于波段筛选的光谱加权集成校正模型的构建方法及系统。
技术介绍
近红外光谱技术是一种非常重要的无损检测技术,其应用领域十分广泛。虽然近红外光谱具有检测速度快,没有污染等优点,但是其光谱重叠严重等缺点对校正模型的要求很高。因此为了提高校正模型的精确度,增加校正模型的稳定性,近红外光谱的波段选择引起了普遍的关注。随着集成学习在各个领域的渗透,基于波段筛选的集成校正模型成为提高近红外光谱校正模型精确度和稳定性的首选方法之一。与传统的多元校正模型相比,集成校正模型精确度更好,稳定性更高。其原因在于,多个子模型的集成结果减少了校正结果对单一模型的绝对依赖性。目前,近红外光谱校正模型主要有对波长变量聚类,然后在每一类中随机选取一个,再进行集成的模型。以及利用自组织神经网络对波长变量聚类,然后最小化交叉误差确定权重的集成学习方法。此外,还有通过对波长变量赋权的集成学习方法和基于波长变量选择框架的集成方法。然而已有的这些集成校正模型的稳定性以及权重设置仍然没有很好的解决。基于上述技术问题,需要设计一种新的基于波段筛选的光谱加权集成校正模型的构建方法及系统。
技术实现思路
本专利技术的目的是提供一种基于波段筛选的光谱加权集成校正模型的构建方法及系统。为了解决上述技术问题,本专利技术提供了一种基于波段筛选的光谱加权集成校正模型的构建方法,包括:红外光谱波长聚类;对聚类后的红外光谱波长剪枝;根据剪枝后的红外光谱波长构建综合加权系数;根据综合加权系数构建加权集成校正模型;以及通过加权集成校正模型得到预测含量矩阵。进一步,所述红外光谱波长聚类的方法包括:训练集所含S个样品的近红外光谱矩阵为X∈RM×S,M为波长变量数,物质真实含量化学值矩阵为Y∈RS×1,1表示列数是1,R表示实数,则对近红外光谱矩阵X=(r1,r2,…,rM)T按照波长划分获得波长列向量r1,r2,…,rM,对r1,r2,…,rM进行聚类,分成N类,T表示转置。进一步,所述对聚类后的红外光谱波长剪枝的方法包括:对每一类波长变量对应的近红外光谱矩阵和物质真实含量化学值矩阵Y∈RS×1分别进行偏最小二乘PLS建模得到预测含量矩阵通过比较与Y获得每一类波长变量对预测结果的影响;式中,i表示波长变量类i=1,…,N;Mi为第i类波长变量。进一步,所述对聚类后的红外光谱波长剪枝的方法还包括:计算每一类物质含量的最大绝对误差和方差;所述最大绝对误差为:所述方差为:式中,μi为第i类波长变量绝对误差的均值;Ei,j为Ei中第j个样本的物质含量绝对误差值;εi和σi的值越大,则删除或减少第i类波长变量在加权集成校正模型中的权重;通过归一化获得统一指标下εi和σi的综合度量,即式中,i=1,…,N。进一步,所述对聚类后的红外光谱波长剪枝的方法还包括:每一类波长变量对应的εi和σi大小具有同步变化,即最大绝对误差越大的类,其方差也越大;对最大绝对误差和方差归一化的数值求和:zi=εi+σi,并根据zi大小进行剪枝挑选出最大绝对误差和方差都较小的类,将zi按照从大到小进行排序,将数值变化较大的波长变量类进行剪枝。进一步,所述根据剪枝后的红外光谱波长构建综合加权系数为:剪枝后波长变量剩余K类,在剩余的波长变量每一类中随机选取一个波长则K个波长对应的光谱矩阵组成一个子训练集;子训练集Xc中每一剩余的波长变量对预测结果的重要性不同;通过归一化的最大绝对误差εi和方差σi构建综合加权系数W修正Xc中剩余的波长变量即W=e-ε·e-σ;式中,c表示剪枝;W表示加权系数,W=(w1,w2,…,wK),ε=(ε1,ε2,…,εK),σ=(σ1,σ2,…,σK)。进一步,所述构建加权集成校正模型的方法为:结合物质真实含量化学值矩阵Y∈RS×1利用PLS构建预测子模型得到β的计算值重复Tc次获得Tc个子加权集成校正模型从而得到并利用Tc个得到加权集成校正模型的式中,β为回归系数;e为误差;U,V为对X,Y进行主成份分析的因子矩阵,满足X=UP,Y=VQ,T表示转置,(UTU)-1表示矩阵(UTU)的逆矩阵。进一步,所述通过加权集成校正模型得到预测含量矩阵的方法为:将预测集的光谱矩阵Xp利用W进行修正形成并代入公式:得到物质的预测含量矩阵另一方面,本专利技术还提供一种基于波段筛选的近红外光谱加权集成校正模型系统,包括:聚类模块,红外光谱波长聚类;剪枝模块,对聚类后的红外光谱波长剪枝;加权系数模块,根据剪枝后的红外光谱波长构建综合加权系数;校正模型模块,根据综合加权系数构建加权集成校正模型;以及预测含量矩阵模块,通过加权集成校正模型得到预测含量矩阵。本专利技术的有益效果是,本专利技术通过红外光谱波长聚类;对聚类后的红外波长剪枝;根据剪枝后的红外波长构建综合加权系数;根据综合加权系数构建加权集成校正模型;以及通过加权集成校正模型得到预测含量矩阵,实现了加强加权集成校正模型稳定性。附图说明下面结合附图和实施例对本专利技术进一步说明。图1是本专利技术所涉及的基于波段筛选的光谱加权集成校正模型的构建方法的流程图;图2是本专利技术所涉及的基于波段筛选的光谱加权集成校正模型的流程图。具体实施方式现在结合附图对本专利技术作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本专利技术的基本结构,因此其仅显示与本专利技术有关的构成。实施例1图1是本专利技术所涉及的基于波段筛选的光谱加权集成校正模型的构建方法的流程图。如图1所示,本实施例提供了一种基于波段筛选的光谱加权集成校正模型的构建方法,包括:红外光谱波长聚类;对聚类后的红外光谱波长剪枝;根据剪枝后的红外光谱波长构建综合加权系数;根据综合加权系数构建加权集成校正模型;以及通过加权集成校正模型得到预测含量矩阵,实现了加强加权集成校正模型稳定性。图2是本专利技术所涉及的基于波段筛选的光谱加权集成校正模型的流程图。如图2所示,在本实施例中,所述红外光谱波长聚类的方法包括:设训练集所含S个样品的近红外光谱矩阵为X∈RM×S,M为波长变量数,物质真实含量化学值矩阵为Y∈RS×1,1表示列数是1,R表示实数,则对近红外光谱矩阵X=(r1,r2,…,rM)T按照波长划分获得波长列向量r1,r2,…,rM,对r1,r2,…,rM进行聚类,分成N类,T表示转置。在本实施例中,所述对聚类后的红外光谱波长剪枝的方法包括:对每一类波长变量对应的近红外光谱矩阵和物质真实含量化学值矩阵Y∈RS×1分别进行偏最小二乘PLS建模得到预测含量矩阵通过比较与Y获得每一类波长变量对预测结果的影响;式中,i表示波长变量类i=1,…,N;Mi为第i类波长变量。在本实施例中,所述对聚类后的红外光谱波长剪枝的方法还包括:计算每一类物质含量的最大绝对误差和方差;所述最大绝对误差为:所述方差为:式中,μi为第i类波长变量绝对误差的均值;Ei,j为Ei中第j个样本的物质含量绝对误差值;不失一般性,εi和σi的值越大,那么第i类波长变量建模的预测结果越差,在加权集成校正模型中这一类波长就需要被删除或者减少其在加权集成校正模型中的权重;由于εi和σi(i=1,…,N)的数量单位不一样,构造一个统一指标对εi和σi进行综合度量,需要将二者进行归一化处理,即在本文档来自技高网...

【技术保护点】
1.一种基于波段筛选的光谱加权集成校正模型的构建方法,其特征在于,包括:红外光谱波长聚类;对聚类后的红外光谱波长剪枝;根据剪枝后的红外光谱波长构建综合加权系数;根据综合加权系数构建加权集成校正模型;以及通过加权集成校正模型得到预测含量矩阵。

【技术特征摘要】
1.一种基于波段筛选的光谱加权集成校正模型的构建方法,其特征在于,包括:红外光谱波长聚类;对聚类后的红外光谱波长剪枝;根据剪枝后的红外光谱波长构建综合加权系数;根据综合加权系数构建加权集成校正模型;以及通过加权集成校正模型得到预测含量矩阵。2.如权利要求1所述的构建方法,其特征在于,所述红外光谱波长聚类的方法包括:训练集所含S个样品的近红外光谱矩阵为X∈RM×S,M为波长变量数,物质真实含量化学值矩阵为Y∈RS×1,1表示列数是1,R表示实数,则对近红外光谱矩阵X=(r1,r2,…,rM)T按照波长划分获得波长列向量r1,r2,…,rM,对r1,r2,…,rM进行聚类,分成N类,T表示转置。3.如权利要求2所述的构建方法,其特征在于,所述对聚类后的红外光谱波长剪枝的方法包括:对每一类波长变量对应的近红外光谱矩阵和物质真实含量化学值矩阵Y∈RS×1分别进行偏最小二乘PLS建模得到预测含量矩阵通过比较与Y获得每一类波长变量对预测结果的影响;式中,i表示波长变量类i=1,…,N;Mi为第i类波长变量。4.如权利要求3所述的构建方法,其特征在于,所述对聚类后的红外光谱波长剪枝的方法还包括:计算每一类物质含量的最大绝对误差和方差;所述最大绝对误差为:所述方差为:式中,μi为第i类波长变量绝对误差的均值;Ei,j为Ei中第j个样本的物质含量绝对误差值;εi和σi的值越大,则删除或减少第i类波长变量在加权集成校正模型中的权重;通过归一化获得统一指标下εi和σi的综合度量,即式中,i=1,…,N。5.如权利要求4所述的构建方法,其特征在于,所述对聚类后的红外光谱波长剪枝的方法还包括:每一类波长变量对应的εi和σi大小具有同步变化,即最大绝对误差越大的类,其方差也越大;对最大绝对误差和方差归一化的...

【专利技术属性】
技术研发人员:于绍慧
申请(专利权)人:合肥师范学院
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1