一种具有变量选择功能的红外光谱定量分析方法技术

技术编号:12583524 阅读:79 留言:0更新日期:2015-12-23 23:49
本发明专利技术公开了一种具有变量选择功能的红外光谱定量分析方法。本发明专利技术提出一种新的红外光谱定量分析建模方法;这种方法在建模的过程中具有变量选择功能,在每一次收缩过程中能选中相同的变量,以便于分析物质浓度和变量之间的相关关系。本发明专利技术通过建立新的算法模型对红外光谱数据进行分析,分析获得的数据结果相对于传统的偏最小二乘算法误差小,分析过程中使用的变量也更少。

【技术实现步骤摘要】

本专利技术属于红外光谱分析方法,具体涉及一种具有变量选择功能的红外光谱定量 分析方法。
技术介绍
红外光谱法越来越多的用于固体,半固体,液体和气体样本的特征分析。通常,样 本的特征主要由组分的浓度含量确定。偏最小二乘回归是一种常用的对红外光谱矩阵X和 物质浓度矩阵Y建模的方法。偏最小二乘回归的基本思路是这样的,首先即寻找向量W和 c满足: 其中是得分向量u,V之间的协方差。通过拉格朗日乘子法可以得 到向量w满足: XtYYtXw = λ w 于是偏最小二乘可以表示为如下的收缩过程: (1)计算XtYYtXw =入w即求矩阵XtYYtX最大特征值对应的特征向量w ; (2)将矩阵X在特征向量w上投影得到成分t即计算t = Xw ; (3)利用成分t去对矩阵X进行表示,表示系数为p求解模型mny P - (4)更新矩阵X为X1= x-tp τ重复上述步骤k次,得到了 k个特征向量w pW;;,…, Wk进一步得到k个成分t i,t2,…,tk (5)利用k个成分ti,t2,…,tk对浓度矩阵Y进行表示得到 并将n,r2,…,rk保存用于未知浓度的光谱的预测。 对于新到的样本X_浓度未知,那么可以将X _投影到w p w2,…,Wk得到k个成 分1:1,1:2,一,1^利用1'1,1'2,*",1\即可预测其浓度。 在红外光谱分析中,一个很关键的问题是需要分析光谱变量与回归预测结果之间 的关系。最简单的方法是利用特征向量Wl,w2,…,^对变量与回归预测结果的关联性进行 分析。但是利用传统的偏最小二乘回归得到的k个特征向量Wl,W2,…,^对变量与结果关 联性进行分析存在以下问题即W1,W2,…,Wk选中了光谱所有的变量那么回归预测结果就整 个光谱的变量都相关,这实际上没意义,参见图1所示,该图为传统的偏最小乘特征向量W1, ?2的示意图。为了简单起见,只画出两个特征向量^。W2。从图1中可以看到,传统的偏最 小二乘回归得到的向量^,W2在光谱的整个范围,那么也就是说回归的结果和整个光谱都 有关系。参见图2,该图为与变量相关的特征向量W1, W2的示意图。从图2中可以看到,向 量^,《2选中了相同的变量,那么很明显回归的结果就只和选中的1500nm的变量是相关的。 意义就非常明确,即物质浓度回归预测的结果和1500nm附近的变量相关。通过查询红外光 谱分析手册可进一步查询变量和化学基团之间的关系。
技术实现思路
本专利技术的目的在于,提出。这种 方法在建模的过程中具有变量选择功能,在每一次收缩过程中能选中相同的变量,以便于 分析物质浓度和变量之间的相关关系。 为了实现本专利技术的目的,本专利技术提供如下技术方案。 (1)首先提出如下的模型: 其中W = 是特征向量组成的矩阵,max表示求最大值,s. t.表示 约束条件,tr表示求矩阵的迹,I I W| |2,i表示求矩阵的2, 1范数,即首先将矩阵W按行求2 范数再对得到的列向量求1范数。例如对于向量的2范数等于?I,向 量的2范数等于£匕_。 (2)对模型进行求解:将I I W| |2a表示为W2a= tr (WtDW),其中D是一个对角矩阵, 即对角线以外的元素为〇其第i个对角线上的元素为pfe。 求解的具体过程是这样的: (1)固定D利用拉格朗日乘子法,有 则W1,W2,…,w# α X tYYtX- β D和λ XtX的广义特征向量。 (2)固定 W: 求出W = 后将X投影到W得到k个成分tp t2,···,tk,利用k个 成分h,t2,…,tk对浓度矩阵Y进行表示得到 并将ri,r2,…,rk保存用于物质浓度或含量的预测。 对于新样本Χ_浓度未知,那么可以将X _投影到w p w2,…,Wk得到k个成分t i, t2,…,!^,利用即可预测其浓度。 本专利技术建立的模型算法,可利用植物光谱数据,对植物中的碳元素和硫元素含量 组成进行定量分析。优选地,所述植物为羊茅。 进一步地,本专利技术建立的模型算法,还可利用植物光谱数据,定量分析植物中蛋白 质含量。优选地,所述植物为小麦。 与现有技术相比,本专利技术的有益效果如下: 1,本专利技术通过建立新的算法模型对红外光谱数据进行分析,分析获得的数据结果 相对于传统的偏最小二乘算法误差小,分析过程中使用的变量也更少。 2,本专利技术使用的算法模型用到的向量Wl,W2,…,W k具有变量选择功能,并且能选 中相同的变量,因此解释性更强。 3,算法中的参数能够自动迭代更 新。 说明书附图 图1为传统的偏最小乘特征向量W1, W2的示意图; 图2为与变量相关的特征向量W1, W2的示意图; 图3为本专利技术实施例1中羊茅光谱的示意图; 图4为本专利技术实施例1中碳元素含量示意图; 图5为本专利技术实施例1中硫元素含量示意图; 图6为传统的偏最小二乘法分析羊茅光谱的特征向量W1, w2, w3, W4的示意图; 图7为本专利技术的方法分析羊茅光谱的特征向量W1, w2, w3, W4的示意图; 图8为本专利技术实施例2中训练集小麦光谱示意图; 图9为本专利技术实施例2中测试集小麦光谱示意图; 图10为本专利技术实施例2中本专利技术实施例2中训练集蛋白质含量示意图; 图11为本专利技术实施例2中测试集蛋白质含量示意图; 图12为利用本专利技术方法分析小麦蛋白质含量时参数α随迭代次数增加而收敛的 曲线; 图13为利用本专利技术方法分析小麦蛋白质含量时参数β随迭代次数增加而收敛的 曲线。【具体实施方式】 以下通过具体实施例来说明本专利技术的技术方案。 实施例1 :分析一种植物羊茅的光谱 羊茅的光谱数据集,包含有141个近红外光谱,是将每一个羊茅样本磨成粉末后 采集128次取平均后得到的数据。参见图3,该图为羊茅光谱的示意图。光谱的变量个数 是796。响应矩阵是由碳和硫含量组成,其范围分别是29. 6%-40. 9%,0. 3%-1.7%。参 见图4和图5,图4为碳元素含量示意图,图5为硫元素含量示意图。 建模与定量分析过程是这样的: -:建模阶段 1 :选择前71个光谱及其对应的碳、硫含量作为训练样本,用于计算模型中的W = ;剩下的70个光谱即对应的碳、硫含量作为定量分析的测试样本;记Xt当前第1页1 2 本文档来自技高网
...

【技术保护点】
一种具有变量选择功能的红外光谱定量分析方法,所述分析方法通过如下模型实现:maxW(tr(WTXTYYTXW)||W||2,1)s.t.WTXTXW=In×n]]>其中W=[w1,w2,…,wk]是特征向量组成的矩阵,max表示求最大值,s.t.表示约束条件,tr表示求矩阵的迹,||W||2,1表示求矩阵的2,1范数,即首先将矩阵W按行求2范数再对得到的列向量求1范数。例如对于向量[a1,a2…,ak]的2范数等于向量[a1,a2,…,ak]的1范数等于对前述模型求解,求出W=[w1,w2,…,wk]后,将X投影到W得到k个成分t1,t2…,tk,利用k个成分t1,t2…,tk对浓度矩阵Y进行表示得到Y=t1r1T+t2r2T+...+tkrkT]]>并将r1,r2,…,rk保存,用于物质浓度或含量的预测。

【技术特征摘要】

【专利技术属性】
技术研发人员:牟怿尤新革徐端全王慧玲李家斌江修保
申请(专利权)人:深圳华中科技大学研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1