一种基于多传感器光谱数据的波长点筛选方法技术

技术编号:34014076 阅读:18 留言:0更新日期:2022-07-02 15:19
本发明专利技术涉及近红外光谱分析技术,其公开了一种基于多传感器光谱数据的波长点筛选方法,目的在于减小光谱数据量,提升光谱分析效率,同时提高光谱模型准确性及稳定性。该方法首先导入原始多传感器光谱数据,按照传感器数目对光谱数据进行分类,获得单量数据,然后对各个单量数据进行偏最小二乘法建模,获取各个模型均方根误差值,结合均方根误差值计算各个单量数据表征系数,接着结合单量数据波长点数及表征系数对各个单量数据进行波长点数目筛选,最后结合各个单量数据波长点数目对波长点进行筛选,将筛选完成后的各个单量数据进行重组获得多量数据。得多量数据。得多量数据。

【技术实现步骤摘要】
一种基于多传感器光谱数据的波长点筛选方法


[0001]本专利技术涉及近红外光谱分析技术,具体涉及基于多传感器光谱数据的波长点筛选方法。

技术介绍

[0002]近年来,近红外光谱分析技术发展十分迅速,已在化工,制药,军工,食品等多个领域都获得了应用。近红外光谱技术属于分子光谱技术,可以在分子水平上表明物质成分和性质信息,不论对经济还是社会影响来说,都取得了非常高的效益,极具发展潜力。
[0003]然而,目前大多数物质成分和性质信息检测主要使用大型实验室近红外光谱仪器进行,这些方法虽然定量准确灵敏度高,但所需设备体积庞大,设备费用昂贵,样品制备时间长且样品制作方法严格,检测设备和样品制备需要专业人员操作,检测环境固定,且分析时间长,不适用于现场检测,不便于推广使用。
[0004]伴随着便携式近红外光谱技术的发展,市场主流的大型近红外光谱仪设备都朝着体积小巧,价格低廉的便携式方向发展,而目前市场上的便携式近红外光谱仪以单传感器设备为主,单传感器设备受到传感器技术的限制,其涵盖波段范围十分有限,采集得到的光谱数据稳定性较差,光谱数据容易发生偏移,进而容易造成预测效果不稳定,准确率低的问题。
[0005]为了增大传感器波段涵盖范围,提升便携式近红外光谱仪的应用场景,多传感器便携式近红外光谱仪应运而生,虽然多传感器便携式近红外光谱仪能够良好解决单传感器设备的各项问题,但是由于多传感器便携式近红外光谱仪传感器数量的增加,其采集获取光谱数据波长点数目相较于原始单传感器光谱数据波长点成倍数增加,采集到的数据也较为冗余,包含了过多与样品相关性较小的数据信息,不仅使得常规光谱数据分析方法无法适用于多传感器光谱数据分析,同时由于光谱数据量的增大,极大程度的降低了便携式近红外光谱分析技术的分析效率。

技术实现思路

[0006]本专利技术所要解决的技术问题是:提出一种基于多传感器光谱数据的波长点筛选方法,目的在于减小光谱数据量,提升光谱分析效率,同时提高光谱模型准确性及稳定性。
[0007]本专利技术解决上述技术问题采用的技术方案是:
[0008]一种基于多传感器光谱数据的波长点筛选方法,包括以下步骤:
[0009]S1、导入原始多传感器光谱数据,按照传感器数目对光谱数据进行分类,获得单量数据;
[0010]S2、对各组单量数据进行偏最小二乘法建模,获取各个模型均方根误差值;
[0011]S3、结合均方根误差值计算各组单量数据表征系数;
[0012]S4、结合单量数据波长点数及表征系数对各组单量数据进行波长点数目筛选;
[0013]S5、结合各组单量数据波长点数目对波长点进行筛选,将筛选完成后的各组单量
数据进行重组获得多量数据。
[0014]进一步的,步骤S2中,所述均方根误差采用留一法进行交叉验证生成,表达式为:
[0015][0016]其中,M为原始样本个数,y
i
为样本x
i
的标定值,为样本x
i
的预测值。
[0017]进一步的,步骤S3中,所述结合均方根误差值计算各组单量数据表征系数,具体包括:
[0018]光谱模型的均方根误差RMESCV值越小的单量数据,其表征系数越高,计算方式为:
[0019][0020]其中,α
n
为第n组单量数据的表征系数,A
n
为第n组单量数据建立的光谱模型的均方根误差RMESCV值。
[0021]进一步的,步骤S4中,所述结合单量数据波长点数及表征系数对各组单量数据进行波长点数目筛选,具体包括:
[0022]各组单量数据对应的表征系数越高,则说明该单量数据的样品表征能力越强,在进行波长点数目筛选时应保留的波长点数目越多,计算方式为:
[0023]X
i
=Round(α
i
*100%*m)
[0024]其中,α
i
为第i组单量数据的表征系数,m为需要从所有单量数据中筛选出来的波长点数目总和,Round()为四舍五入函数,X
i
为第i组单量数据中需要保留的波长点数目。
[0025]进一步的,步骤S5中,所述结合各组单量数据波长点数目对波长点进行筛选,具体包括:
[0026]采用逐步回归的方法对各组单量数据中的波长点进行逐一验证,通过均方根误差值逐一排除表征能力弱的波长点,保留表征能力强的波长点。
[0027]进一步的,步骤S5具体包括:
[0028]S51、从第i组单量数据中随机选取X
i
个波长点作为初始波长点,将剩余的(z

X
i
)个波长点作为迭代波长点,i=1;z为第i组单量数据中的波长点数量;
[0029]S52、对初始波长点进行光谱建模,计算得到该光谱模型的均方根误差RMSECV值T0;
[0030]S53、从迭代波长点中选出1个波长点引入初始波长点中,并逐一替代初始波长点中的第1到第X
i
个波长点,始终保持初始波长点的个数为X
i
个;
[0031]S54、对替代后的初始波长点进行光谱建模,计算得到这些光谱模型的均方根误差RMSECV值T
j
(j=1,2,
……
X
i
);
[0032]S55、比较T0与T
j
的大小,并进行相应操作:
[0033]若T
j
均大于T0,则说明加入迭代波长点后光谱模型的均方根误差RMSECV值增大,对应的光谱模型样品表征能力变弱,则对此迭代波长点进行舍弃,初始波长点不变;
[0034]若T
j
均等于T0,则说明迭代波长点的引入对光谱模型并未有影响,则对此迭代波长点舍弃,初始波长点不变;
[0035]若T
j
中的某个值小于T0,则说明在替换对应初始波长点,加入迭代波长点后光谱模
型的均方根误差RMSECV值减小,对应的光谱模型样品表征能力变强,则对此迭代波长点进行引入,同时为了保证初始波长点数目不变,对T
j
中某个值小于T0情况下对应的初始波长点进行剔除操作;
[0036]若T
j
中存在多个值小于T0,则对此迭代波长点进行引入,同时剔除使得T
j
为最小值时,对应的初始波长点;
[0037]S56、重复步骤S53

S55,对剩余的迭代波长点进行逐一引入,直至全部的迭代波长均被遍历,最终筛选获得的波长点即为第i组单量数据的筛选波长点;
[0038]S57、赋值i=i+1,返回步骤S51,直至完成所有单量数据的波长点筛选;
[0039]S58、对所有单量数据筛选出的波长点进行重组,获得多量数据。
[0040]本专利技术的有益效果是:
[0041]该方法通过单量数据的光谱本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多传感器光谱数据的波长点筛选方法,其特征在于,包括以下步骤:S1、导入原始多传感器光谱数据,按照传感器数目对光谱数据进行分类,获得单量数据;S2、对各组单量数据进行偏最小二乘法建模,获取各个模型均方根误差值;S3、结合均方根误差值计算各组单量数据表征系数;S4、结合单量数据波长点数及表征系数对各组单量数据进行波长点数目筛选;S5、结合各组单量数据波长点数目对波长点进行筛选,将筛选完成后的各组单量数据进行重组获得多量数据。2.如权利要求1所述的一种基于多传感器光谱数据的波长点筛选方法,其特征在于,步骤S2中,所述均方根误差采用留一法进行交叉验证生成,表达式为:其中,M为原始样本个数,y
i
为样本x
i
的标定值,为样本x
i
的预测值。3.如权利要求1所述的一种基于多传感器光谱数据的波长点筛选方法,其特征在于,步骤S3中,所述结合均方根误差值计算各组单量数据表征系数,具体包括:光谱模型的均方根误差RMESCV值越小的单量数据,其表征系数越高,计算方式为:其中,α
n
为第n组单量数据的表征系数,A
n
为第n组单量数据建立的光谱模型的均方根误差RMESCV值。4.如权利要求1所述的一种基于多传感器光谱数据的波长点筛选方法,其特征在于,步骤S4中,所述结合单量数据波长点数及表征系数对各组单量数据进行波长点数目筛选,具体包括:各组单量数据对应的表征系数越高,则说明该单量数据的样品表征能力越强,在进行波长点数目筛选时应保留的波长点数目越多,计算方式为:X
i
=Round(α
i
*100%*m)其中,α
i
为第i组单量数据的表征系数,m为需要从所有单量数据中筛选出来的波长点数目总和,Round()为四舍五入函数,X
i
为第i组单量数据中需要保留的波长点数目。5.如权利要求1所述的一种基于多传感器光谱数据的波长点筛选方法,其特征在于,步骤S5中,所述结合各组单量数据波长点数目对波长点进行筛选,具体包括:采用逐步回归的方法对各组单量数据中的波长点进行逐一验证,通过均方根误差值逐一排除表征能力弱的波长点,保留表征能力强的波长点。6....

【专利技术属性】
技术研发人员:刘浩何涛夏维高闫晓剑张国宏王毅
申请(专利权)人:四川启睿克科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1