一种基于多组分样品的多传感器光谱数据处理方法技术

技术编号:33794693 阅读:13 留言:0更新日期:2022-06-12 14:55
本发明专利技术涉及近红外光谱分析技术,其公开了一种基于多组分样品的多传感器光谱数据处理方法,提高便携式多传感器光谱设备的预测分析能力。该方法包括:采集多组分样品的原始多传感器光谱数据,按照传感器型号对数据进行分类分解,获得单波段数据集;将各个单波段数据集按照样品数目进行二次分集,获得单波段训练集及验证集;结合多组分样品的各个组分含量标定值对各个单波段训练集进行光谱建模,并采用建立的光谱模型对相应的验证集进行预测,计算单波段光谱模型的预测准确率;结合各个单波段光谱模型对不同组分的预测准确率,计算单波段光谱模型对不同组分含量的表征系数;对于待测未知样品不同组分,结合各个单波段光谱模型的表征系数对其对应预测值进行表征化处理,获得最终预测值。终预测值。终预测值。

【技术实现步骤摘要】
一种基于多组分样品的多传感器光谱数据处理方法


[0001]本专利技术涉及近红外光谱分析技术,具体涉及一种基于多组分样品的多传感器光谱数据处理方法。

技术介绍

[0002]随着微机电技术的发展,近几年,便携式近红外光谱仪被广泛应用于食品、饮料、医药、煤炭等各个领域。便携式近红外光谱仪不仅可以多组分平行检测,相较于传统的大型傅里叶变换光谱分析系统,其具有结构简单、成本低廉、携带方便、结果实时可见等优势,目前已成为光谱领域的热门产品。
[0003]目前市场上的便携式近红外光谱仪以单传感器设备为主,单传感器设备受到传感器技术的限制,其涵盖波段范围十分有限,采集得到的光谱数据稳定性较差,光谱数据容易发生偏移,进而容易造成预测效果不稳定,准确率低的问题。
[0004]为了增大传感器波段涵盖范围,提升便携式近红外光谱仪的应用场景,多传感器便携式近红外光谱仪应运而生,虽然多传感器便携式近红外光谱仪能够良好解决单传感器设备的各项问题,但如果采用传统的单传感器光谱数据处理方法对多传感器光谱数据进行处理,由于各个传感器光谱数据对待测样品各组分含量表征能力不同而容易引起预测值与实际标定值之间差异较大,从而降低便携式近红外设备对待测样品各个组分的预测分析能力。

技术实现思路

[0005]本专利技术所要解决的技术问题是:提出一种基于多组分样品的多传感器光谱数据处理方法,提高便携式多传感器光谱设备的预测分析能力。
[0006]本专利技术解决上述技术问题采用的技术方案是:
[0007]一种基于多组分样品的多传感器光谱数据处理方法,包括以下步骤:
[0008]S1、采集多组分样品的原始多传感器光谱数据,按照传感器型号对光谱数据进行分类分解,获得单波段数据集;
[0009]S2、将各个单波段数据集按照样品数目进行二次分集,获得不同分集方式下的单波段训练集及验证集;
[0010]S3、结合多组分样品的各个组分含量标定值对不同分集方式下的各个单波段训练集进行光谱建模,并采用建立的光谱模型对相应的验证集进行预测,计算不同分集方式下单波段光谱模型的预测准确率;
[0011]S4、结合不同分集方式下各个单波段光谱模型对不同组分的预测准确率,计算单波段光谱模型对不同组分含量的表征系数;
[0012]S5、对于待测未知样品不同组分,结合不同分集方式下各个单波段光谱模型的表征系数对其对应预测值进行表征化处理,获得最终预测值。
[0013]进一步的,步骤S1中,获得的单波段数据集的个数与多传感器光谱仪中的传感器
型号个数对应,即,每一型号的传感器对应一个单波段数据集。
[0014]进一步的,步骤S2中,所述将各个单波段数据集按照样品数目进行二次分集,获得不同分集方式下的单波段训练集及验证集,具体包括:
[0015]采用时间顺序的方式将单波段数据集划分为折中训练集和折中验证集,即按照数据采集时间线,将前期采集的一定量光谱数据划分为折中训练集,剩余的一定量光谱数据划分为折中验证集;从而获得时间序列分集方式下的单波段训练集及验证集;
[0016]以及,采用随机划分的方式将单波段数据集划分为随机训练集和随机验证集,即在单波段数据集中的样品数据中随机选取一定量的光谱数据划分为随机训练集,剩余的一定量光谱数据划分为随机验证集;从而获得随机划分分集方式下的单波段训练集及验证集。
[0017]进一步的,步骤S2中,经过二次分集后,折中训练集和折中验证集中的数据比例以及随机训练集和随机验证集中的数据比例均为4:1。
[0018]进一步的,步骤S3中,所述采用建立的光谱模型对相应的验证集进行预测,计算不同分集方式下单波段光谱模型的预测准确率,具体包括:
[0019]利用在某一分集方式下的单波段训练集建立的光谱模型对该分集方式下的验证集中的光谱数据进行预测,若预测值与标定值的偏差在容错范围内,则判定为预测正确,通过对预测正确的光谱数据进行数量统计,获得统计值,则:
[0020]该分集方式下单波段光谱模型的预测准确率=统计值/验证集中的光谱数据数量值*100%。
[0021]进一步的,步骤S4中,所述结合不同分集方式下各个单波段光谱模型对不同组分的预测准确率,计算单波段光谱模型对不同组分含量的表征系数,具体包括:
[0022][0023][0024]其中,T
i
为时间序列分集方式下的第i个单波段光谱模型的预测准确率;a
i
为时间序列分集方式下的第i个单波段光谱模型对某一组分含量的表征系数;T
i

为随机划分分集方式下的第i个单波段光谱模型的预测准确率;a
i

为随机划分分集方式下的第i个单波段光谱模型对某一组分含量的表征系数;n为单波段光谱模型的个数(也是传感器的数量)。
[0025]进一步的,步骤S5中,所述对于待测未知样品不同组分,结合不同分集方式下各个单波段光谱模型的表征系数对其对应预测值进行表征化处理,获得最终预测值,具体包括:
[0026][0027]其中,A为对该待测未知样品的某一组分的最终预测值,A
i
为时间序列分集方式下的第i个单波段光谱模型对该待测未知样品中该组分的预测值;A
i

为随机划分分集方式下的第i个单波段光谱模型对该待测未知样品中该组分的预测值。
[0028]本专利技术的有益效果是:
[0029]该方法针对多组分样品的多传感器数据,采用预测准确率为指标,对应不同传感器光谱数据对不同组分样品的表征能力,进一步计算出表征系数进而对不同传感器预测值
进行表征化处理,由于考虑了不同传感器光谱数据对不同组分样品的表征能力,极大程度的提高了便携式多传感器光谱设备的预测分析能力。
附图说明
[0030]图1是本专利技术实施例中的基于多组分样品的多传感器光谱数据处理方法流程图;
[0031]图2是本专利技术实施例中的便携式多传感器近红外光谱仪各个传感器的排布示意图。
具体实施方式
[0032]本专利技术旨在提出一种基于多组分样品的多传感器光谱数据处理方法,提高便携式多传感器光谱设备的预测分析能力。该方法首先采集多组分样品的原始多传感器光谱数据,按照传感器型号对光谱数据进行分类分解,获得单波段数据集;然后,将各个单波段数据集按照样品数目进行二次分集,获得单波段训练集及验证集;接着,结合多组分样品的各个组分含量标定值对各个单波段训练集进行光谱建模,并采用建立的光谱模型对相应的验证集进行预测,计算单波段光谱模型的预测准确率;再接着结合各个单波段光谱模型对不同组分的预测准确率,计算单波段光谱模型对不同组分含量的表征系数;最后,对于待测未知样品不同组分,结合各个单波段光谱模型的表征系数对其对应预测值进行表征化处理,获得最终预测值。
[0033]本专利技术方案采用预测准确率为指标,对应不同传感器光谱数据对不同组分样品的表征能力,进一步计算出表征系数进而对不同传感本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多组分样品的多传感器光谱数据处理方法,其特征在于,包括以下步骤:S1、采集多组分样品的原始多传感器光谱数据,按照传感器型号对光谱数据进行分类分解,获得单波段数据集;S2、将各个单波段数据集按照样品数目进行二次分集,获得不同分集方式下的单波段训练集及验证集;S3、结合多组分样品的各个组分含量标定值对不同分集方式下的各个单波段训练集进行光谱建模,并采用建立的光谱模型对相应的验证集进行预测,计算不同分集方式下单波段光谱模型的预测准确率;S4、结合不同分集方式下各个单波段光谱模型对不同组分的预测准确率,计算单波段光谱模型对不同组分含量的表征系数;S5、对于待测未知样品不同组分,结合不同分集方式下各个单波段光谱模型的表征系数对其对应预测值进行表征化处理,获得最终预测值。2.如权利要求1所述的一种基于多组分样品的多传感器光谱数据处理方法,其特征在于,步骤S1中,获得的单波段数据集的个数与多传感器光谱仪中的传感器型号个数对应,即,每一型号的传感器对应一个单波段数据集。3.如权利要求1所述的一种基于多组分样品的多传感器光谱数据处理方法,其特征在于,步骤S2中,所述将各个单波段数据集按照样品数目进行二次分集,获得不同分集方式下的单波段训练集及验证集,具体包括:采用时间顺序的方式将单波段数据集划分为折中训练集和折中验证集,即按照数据采集时间线,将前期采集的一定量光谱数据划分为折中训练集,剩余的一定量光谱数据划分为折中验证集;从而获得时间序列分集方式下的单波段训练集及验证集;以及,采用随机划分的方式将单波段数据集划分为随机训练集和随机验证集,即在单波段数据集中的样品数据中随机选取一定量的光谱数据划分为随机训练集,剩余的一定量光谱数据划分为随机验证集;从而获得随机划分分集方式下的单波段训练集及验证集。4.如权利要求3所述的一种基于多组分样品的多传感器光谱数据处理方法,其特征在于,步骤S2中,经过二次分集后,折中训练集和折中验证集中的数据比例以及随机训练集和随机验证集中的数据比例均为4:1...

【专利技术属性】
技术研发人员:刘浩夏维高何涛闫晓剑张国宏贾利红
申请(专利权)人:四川启睿克科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1