一种基于逐步缩短步长优中选优的近红外光谱特征波数的筛选方法技术

技术编号:29050414 阅读:19 留言:0更新日期:2021-06-26 06:13
本发明专利技术公开了一种基于逐步缩短步长优中选优的近红外光谱特征波数的筛选方法,属于近红外光谱快速检测技术领域。该方法采用一定步长分割全波数的近红外光谱图,将分割后的每段光谱,分别采用偏最小二乘法建立模型,选择交叉验证决定系数和外部验证决定系数同时大于等于K值的波数段为优选波数段;再进一步地缩短步长,将优选的波数段进行分割,然后进行优选。如此多次缩短步长进行优中选优,最终获得近红外光谱的特征波数。本发明专利技术所述方法易实现、操作简单,不用编写程序代码,在常用的近红外光谱数据处理软件中就可以操作完成,获得的优选波数段与y值(即样品的真实值)的相关度和精准度更高。精准度更高。精准度更高。

【技术实现步骤摘要】
一种基于逐步缩短步长优中选优的近红外光谱特征波数的筛选方法


[0001]本专利技术属于近红外光谱快速检测
,具体涉及一种基于逐步缩短步长优中选优的近红外光谱特征波数的筛选方法。

技术介绍

[0002]近红外(Near Infrared,NIR)光的本质是一种电磁波,按照美国材料试验学会的定义,其波长在780

2526nm之间,对应波数范围为12800cm
‑1‑
4000cm
‑1之间,主要反映的是O

H、N

H和C

H等化学键振动的倍频和合频信息。近红外光谱与其吸收光谱按照朗伯—比耳定律作定量分析,研究样品光谱与质量参数间的关系,建立两者之间的数学模型,然后用该数学模型预测未知样品的相关质量系数,对样品进行定量分析。近红外光谱分析技术是由硬件、化学计量学软件和模型三部分构成,傅里叶变换近红外光谱仪用于采集样品的近红外光谱,化学计量学软件用于建立预测模型,预测模型用于待测样品的定量和定性预测分析。近红外光谱技术分析样品具有方便、快速、高效、准确和成本较低,不破坏样品,不消耗化学试剂,不污染环境等优点,因此该技术受到越来越多人的青睐。
[0003]目前,在近红外光谱快速检测
,由于近红外光谱吸收谱带共线性严重、信息冗余和含有噪音干扰波数,导致建立的模型预测能力差。通过用特殊的方法选择特征波数代替全波数,不仅可以降低全光谱的数据量,还能够提高模型的运算速度,而且可以提高模型的性能。
专利技术内容
[0004]有鉴于此,为了解决近红外光谱吸收谱带共线性严重、信息冗余和含有噪音干扰,导致建立的模型预测能力差的技术难题,本专利技术提供一种基于逐步缩短步长优中选优的近红外光谱特征波数的筛选方法。该方法通过选择与响应值相关性高的波数段,舍去相关性不高的波数段,减少模型的输入变量,减少干扰变量,缩短模型的计算时间,提升模型的预测能力。
[0005]为了实现上述目的,本专利技术采用如下技术方案:
[0006]一种基于逐步缩短步长优中选优的近红外光谱特征波数的筛选方法,该方法包括以下步骤:
[0007]S1、将全波数的近红外光谱按照步长200~500cm
‑1划分成若干段,将每一段命名为1、2、3、4
……
M,M为逐步分割近红外光谱图时获得片段的自然排序编号,分别采用偏最小二乘法建立模型,选择交叉验证决定系数R2cv和外部验证决定系数R2val同时大于等于K的波数段为优选波数段;
[0008]S2、将步骤S1中获得的优选波数段,进一步缩短步长,按照步长50~200cm
‑1划分成若干段,将每一段命名为M.1、M.2、M.3、M.4
……
M.N,N为逐步分割近红外光谱图时获得片段的自然排序编号,分别采用偏最小二乘法建立模型,选择交叉验证决定系数R2cv和外部验
证决定系数R2val同时大于等于K的波数段为优选波数段;
[0009]S3、将步骤S2中获得的优选波数段,进一步缩短步长,按照步长10~50cm
‑1划分成若干段,将每一段命名为M.N.1、M.N.2、M.N.3、M.N.4
……
M.N.P,P为逐步分割近红外光谱图时获得片段的自然排序编号,分别采用偏最小二乘法建立模型,选择交叉验证决定系数R2cv和外部验证决定系数R2val同时大于等于K的波数段为优选波数段;
[0010]S4、将步骤S3中获得的优选波数段,进一步缩短步长,按照步长1~10cm
‑1划分成若干段,将每一段命名为M.N.P.1、M.N.P.2、M.N.P.3、M.N.P.4
……
M.N.P.Q,Q为逐步分割近红外光谱图时获得片段的自然排序编号,分别采用偏最小二乘法建立模型,选择交叉验证决定系数R2cv和外部验证决定系数R2val同时大于等于K的波数段为优选波数段。
[0011]进一步,步骤中所述的交叉验证决定系数式中y值均来自建立模型的样品集。
[0012]进一步,所述的外部验证决定系数式中y值均来自外部验证样品集。
[0013]进一步,所述K的取值范围为:0.70≤K≤1.0。
[0014]与现有技术相比,本专利技术具有以下优点:
[0015](1)易实现。不用编写程序代码,不需要使用MATLAB运行编写的程序。对于近红外光谱技术和化学计量学知识缺乏的科研工作者,也可以非常好的领会和使用本专利技术所述的近红外光谱筛选特征波数的方法。
[0016](2)操作简单。在常用的近红外光谱数据处理软件中就可以操作完成。
[0017](3)优选的评价指标少。近红外光谱筛选特征波数的目的是筛选出与y值(即样品真实值)相关度高的波数段,本专利技术所述方法以交叉验证决定系数(R2cv)、外部验证决定系数(R2val)和K值为评价指标搜索优选相关度高的波数段。
[0018](4)与y值(即样品的真实值)相关度高的优选波数段精准度更高。本专利技术所述方法在于采用逐步缩短步长的方法,将每一步获得的优选波数段,再进一步进行缩短步长分割并进行优选,因此,本专利技术所述的方法获得的优选波数段更精确。
附图说明
[0019]图1为本专利技术所述方法实施步骤流程示意图。
[0020]图2为稻谷样品的近红外光谱图。
[0021]图3为用本专利技术所述方法筛选出的判别稻谷样品霉菌污染的特征波数。
[0022]图4为用本专利技术所述方法筛选出的预测稻谷样品水分含量的特征波数。
具体实施方式
[0023]下面结合附图对本专利技术具体实施例进行详细说明。
[0024]实施例1
[0025]图2为稻谷样品的近红外光谱图,采用近红外光谱技术快速判别稻谷样品是否污染霉菌,使用Bruker MPA型傅立叶变换近红外光谱仪,近红外光谱扫描区域选用3594.9~12790.3cm
‑1,分辨率为16cm
‑1,共有2307个波数点。谱图的两端一般为噪音,谱图中含有信息冗长复杂,且含有很多与分析目标不相关的信息。为了得到一个输入变量少、分析速度快、性能稳定和预测能力强的模型,采用本专利技术所述方法,筛选出与分析目标相关度高的特征波数。图1为本专利技术所述方法实施步骤流程示意图。
[0026]将样品近红外光谱图按照步长为200cm
‑1进行分割,共获得12段光谱,分别采用偏最小二乘法建立模型,选择交叉验证决定系数(R2cv)和外部验证决定系数(R2val)同时大于等于0.80的波数段为优选波数段。由表1可知,第7~12个波数段为优选波数段,共1107个波数点,占全光谱47%。
[0027]表1步长200cm
‑1特征波数筛选结果
[0028][0029][0030]注:
“‑”
代表,相关性极低。
[0031]将第7~12个波数段按照步长为50cm
‑1进行分割,共获得22段光谱,分别采用偏最小本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于逐步缩短步长优中选优的近红外光谱特征波数的筛选方法,其特征在于,该方法包括以下步骤:S1、将全波数的近红外光谱按照步长200~500cm
‑1划分成若干段,将每一段命名为1、2、3、4
……
M,M为逐步分割近红外光谱图时获得片段的自然排序编号,分别采用偏最小二乘法建立模型,选择交叉验证决定系数R2cv和外部验证决定系数R2val同时大于等于K的波数段为优选波数段;S2、将步骤S1中获得的优选波数段,进一步缩短步长,按照步长50~200cm
‑1划分成若干段,将每一段命名为M.1、M.2、M.3、M.4
……
M.N,N为逐步分割近红外光谱图时获得片段的自然排序编号,分别采用偏最小二乘法建立模型,选择交叉验证决定系数R2cv和外部验证决定系数R2val同时大于等于K的波数段为优选波数段;S3、将步骤S2中获得的优选波数段,进一步缩短步长,按照步长10~50cm
‑1划分成若干段,将每一段命名为M.N.1、M.N.2、M.N.3、M.N.4
……
M.N.P,P为逐步分割近红外...

【专利技术属性】
技术研发人员:吕都刘永翔唐健波李俊陈朝军陈中爱
申请(专利权)人:贵州省生物技术研究所贵州省生物技术重点实验室贵州省马铃薯研究所贵州省食品加工研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1