当前位置: 首页 > 专利查询>三峡大学专利>正文

一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法技术

技术编号:17343916 阅读:41 留言:0更新日期:2018-02-25 08:59
一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法,包括步骤:将整个重金属荧光光谱区域划分为k个等宽的波段;对每个子波段上分别建立偏最小二乘模型,得到k个局部回归模型;以RMSECV值衡量各模型精度,取精度最高的局部模型所对应的波段为第一入选波段,并取该局部模型为第一个子模型;用余下的(k‑1)个波段依次与第一入选波段联合,得到(k‑1)个局部模型,选取RMSECV值最低的局部模型所对应的波段为第二入选波段,并取该局部模型为第二个子模型;重复上述过程,直至联合完所有波段;考察每个子模型的RMSECV值,在所有子模型中选出性能最佳者:RMSECV最小,其所对应的区间组合即为最佳组合。本发明专利技术能对模型使用的光谱范围进行优化,提高土壤重金属定量检测模型的精度。

【技术实现步骤摘要】
一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法
本专利技术涉及一种土壤重金属定量检测建模方法,特别是一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法。
技术介绍
土壤重金属污染是土壤污染中污染危害最大、面积最广的环境问题之一。因而对土壤中重金属的检测,已经成为环境保护、农业生产的重要工作,同时也是对污染土壤进行治理和修复的首要环节。EDXRF(能量型X射线荧光)光谱法具有分析速度快、成本低、操作简单、精度高、可原位检测等优点,在许多重金属分析领域已得到应用。然而,目前在土壤重金属定量分析方面还仍然处于探索阶段。由于土壤样本成分复杂,重金属含量相对较低,在检测过程中,容易受到各种因素的干扰。目前重金属相关模型尚不能较好排除与待测重金属无关光谱成分,容易受到光谱噪声干扰。
技术实现思路
为解决上述技术问题,本专利技术提供一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法,能对模型使用的光谱范围进行优化,提高土壤重金属定量检测模型的精度。本专利技术采取的技术方案为:一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法,包括以下步骤:步骤1:将整个重金属荧光光谱区域划分为k个等宽的波段;步骤2:对每个子波段上分别建立偏最小二乘模型,得到k个局部回归模型;步骤3:以RMSECV值衡量各模型精度,取精度最高的局部模型所对应的波段为第一入选波段,并取该局部模型为第一个子模型;步骤4:用余下的(k-1)个波段依次与第一入选波段联合,得到(k-1)个局部模型,选取RMSECV值最低的局部模型所对应的波段为第二入选波段,并取该局部模型为第二个子模型;重复上述过程,直至联合完所有波段;考察步骤2-步骤4中每个子模型的RMSECV值,在所有子模型中选出性能最佳者:RMSECV最小,其所对应的区间组合即为最佳组合。本专利技术一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法,有益效果如下:1、该方法可以过滤全谱中与待测成分无关的光谱区段,提升模型精度。2、相较于经验寻峰法,该方法能够适应仪器误差对待测元素的光谱区段的影响,自动寻找合适的光谱范围进行建模。3、该方法扫描样本时间较短,时间为200秒。4、建模过程相对简单,模型易于实现。附图说明图1为向前偏最小二乘模型对土壤样本的预测结果图。图2为偏最小二乘模型对土壤样本的预测结果图。图3为向前偏最小二乘模型选取的光谱区间图。具体实施方式一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法,包括以下步骤:步骤1:X射线荧光光谱仪输出的离散光谱划分为k个基本等宽的波段wi。记作候选集合Wstep={wi|1≤i≤k},step=0。其中每个波段wi包含了C/k个通道,这里C为一副完整光谱中所包含的通道数。同时指定入选集合(空集),step=0。一个样品的原始光谱信号被光谱仪采集后,会被模数转换成为一系列离散的数字信号值,即通道。对于一次光谱的采集,光谱仪输出的光谱通道数C通常可以配置成1024、4096、8192个不等,每个通道对应在某个波长下的光谱强度。步骤2:使用PLS(偏最小二乘法)算法建立关于波段(Mstep∪w,且w∈Wstep)的局部模型,这里w为候选集合中的某个波段,共计card(Wstep)个局部模型,card代表集合中元素的个数。该步骤建立PLS局部模型时,每个波段采用联合入选集合。所述偏最小二乘模型,是一种经典回归模型,通常采用matlab自带函数pls进行建立模型。偏最小二乘法所建立的数据矩阵X和Y的关系模型为:X=TP+FY=UQ+G这里X为光谱数据矩阵,Y为样本浓度矩阵,T、U为的得分矩阵,P、Q为载荷矩阵,F、G为误差矩阵。步骤3:使用RMSECV对步骤2中建立的所有局部模型进行评估,选取最优的局部模型所联合的候选集合Wstep中波段wa。所述RMSECV是一种评价模型的指标,其计算公式如下:这里yi是预测集样本中第i个样本的预测值,是预测集样本中第i个样本的实际值。IP是预测集样本的个数。值越小,说明模型的精度越高。步骤4:从候选集合Wstep中剔除波段wa得到Wstep+1,然后将wa放进入选集合Mstep中得到Mstep。此时对Mstep+1的PLS模型记为Modelstep+1,模型的RMSECV值记为RMSECVstep+1。步骤5:令step=step+1,转至步骤2,重复至入选集合为空集。步骤6:至此,将得到一系列模型Model1、Model2、Model3…Modeln。同时得到RMSECV1、RMSECV2…RMSECVn。通过比较模型的RMSECV,可以得到最优的模型Modeli即为最终向前偏最小二乘方法选定的模型Yfit=DX+F,其中Yfit为预测的浓度矩阵,D为模型拟合后的系数,F为修正系数。实施步骤:(一)、首先需要建立基于向前间隔偏最小二乘的土壤重金属光谱定量模型,建模方法如下:(1):采集全部样本的X射线荧光光谱,获得光谱矩阵。X射线荧光光谱可以反映了样本的组成和浓度。样本被X射线照射后,样本所含各种元素的原子核被射线激发后产生的荧光,X射线探测器可以检测到这种荧光,并对单位时间内产生荧光光子数和每个光子的能量进行统计,进而形成样品的荧光光谱图,也即是一个一维的行向量。光谱矩阵包含了全部样本的光谱信息,光谱矩阵的每一行表示一个样本光谱。(2):测定全部样本的待测元素的浓度,获得浓度矩阵。浓度单位常为ppm(mg/kg),反映了待测元素在整个样本中的比重。通常可以借助原子吸收、化学分析等方式进行测量。浓度矩阵包含了全部样本的浓度信息,矩阵的每一行对应一个样本。(3):通过浓度梯度法将全部样本进行样本集划分,得到训练集的光谱矩阵浓度矩阵,以及测试集的光谱矩阵和浓度矩阵。浓度梯度法是一种样本集的划分方法,该方法首先将全部样本按照浓度的高低进行排序,然后按照2:1的比例将全部样本划分成训练集和测试集。(4):将训练集样本的光谱矩阵和浓度矩阵带入向前偏最小二乘算法,确立荧光光谱中目标元素的ROI(感兴趣区),并得到相应的模型。感兴趣区是指荧光光谱中的某一特定波长区域,该区域与待测目标元素的相关性较大,能够较好的反映待测元素的浓度。带入模型时需要设置模型的k值(即光谱的分段数),将光谱矩阵的维数按照分段数k进行均匀划分成k段,利用所述向前偏最小二乘模型进行建模。(5):使用测试集样本的X射线荧光光谱,带入步骤(4)建立的模型中,得到测试集样本的预测浓度。将测试集样本的实际浓度和预测浓度进行比较。(二)、实施过程图表:表1为:土壤样本浓度配置方案。图1为:向前偏最小二乘模型对土壤样本的预测结果。图1中纵轴为样本中Cr元素浓度的预测值,横轴为Cr元素浓度的实际值。同时得到预测结果的相关系数为0.98,RMSEP为22.2663。图2为:偏最小二乘模型对土壤样本的预测结果。图2为光谱区段数K=1时的模型,此时该模型退化为偏最小二乘模型。图2中纵轴为样本中Cr元素浓度的预测值,横轴为Cr元素浓度的实际值。同时得到预测结果的相关系数为0.9695,RMSEP为40.0125。相较于图1相关系数偏低,均方根误差偏大,可以得出向前偏最小二乘法是一种更广泛情况下的偏最小二乘法,可以提高模型的精度。图3为:向前偏最小二乘模型的光谱特征本文档来自技高网...
一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法

【技术保护点】
一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法,其特征在于包括以下步骤:步骤1:将整个重金属荧光光谱区域划分为k个等宽的波段;步骤2:对每个子波段上分别建立偏最小二乘模型,得到k个局部回归模型;步骤3:以RMSECV值衡量各模型精度,取精度最高的局部模型所对应的波段为第一入选波段,并取该局部模型为第一个子模型;步骤4:用余下的(k‑1)个波段依次与第一入选波段联合,得到(k‑1)个局部模型,选取RMSECV 值最低的局部模型所对应的波段为第二入选波段,并取该局部模型为第二个子模型;重复上述过程,直至联合完所有波段;考察步骤2‑步骤4中每个子模型的RMSECV值,在所有子模型中选出性能最佳者:RMSECV最小,其所对应的区间组合即为最佳组合。

【技术特征摘要】
1.一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法,其特征在于包括以下步骤:步骤1:将整个重金属荧光光谱区域划分为k个等宽的波段;步骤2:对每个子波段上分别建立偏最小二乘模型,得到k个局部回归模型;步骤3:以RMSECV值衡量各模型精度,取精度最高的局部模型所对应的波段为第一入选波段,并取该局部模型为第一个子模型;步骤4:用余下的(k-1)个波段依次与第一入选波段联合,得到(k-1)个局部模型,选取RMSECV值最低的局部模型所对应的波段为第二入选波段,并取该局部模型为第二个子模型;重复上述过程,直至联合完所有波段;考察步骤2-步骤4中每个子模型的RMSECV值,在所有子模型中选出性能最佳者:RMSECV最小,其所对应的区间组合即为最佳组合。2.一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法,其特征在于包括以下步骤:(1):采集训练集样本的X射线荧光光谱;(2):测定训练集样本的目标元素的化学值;(3):将训练集样本带入变量区间选择算法,确立荧光光谱中目标元素的ROI:感兴趣区;(4):将ROI部分光谱数据和目标元素的化学值带入光谱矫正模型,建立光谱定量模型;(5):采集预测集样本的X射线荧光光谱,提取建模阶段确定的ROI区域的光谱数据为光谱定量模型的输入,得到预测集样本的对应目标元素的含量。3.根据权利要求2所述一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法,其特征在于包括以下步骤:S1,采集与配置土壤样本;S2,采...

【专利技术属性】
技术研发人员:肖敏胡骞梁静
申请(专利权)人:三峡大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1