一种基于统计学的去除拉曼光谱基线的方法技术

技术编号:39039079 阅读:13 留言:0更新日期:2023-10-10 11:52
本发明专利技术公开一种基于统计学的去除拉曼光谱基线的方法,其步骤为:1、对拉曼光谱进行分段;2、统计每段谱的方差并去掉方差大的谱;3、对剩余谱进行曲线拟合;4、原谱数据减去拟合数据得到去除基线后的谱。本发明专利技术利用统计学特性对拉曼光谱进行基线去除,具有高精确度的特点,可用于拉曼光谱的基线去除。可用于拉曼光谱的基线去除。可用于拉曼光谱的基线去除。

【技术实现步骤摘要】
一种基于统计学的去除拉曼光谱基线的方法


[0001]本专利技术涉及光谱分析
具体涉及一种基于统计学的去除拉曼光谱基线的方法。

技术介绍

[0002]拉曼散射现象是印度科学家拉曼在1928年发现的,自那以后拉曼光谱受到科学家的广泛重视并得到广泛应用。但由于荧光等干扰,使采集到的光谱往往包含了基线和噪声,这些因素使得对拉曼光谱的应用造成了很大的干扰,因而需要采用预处理的方法消除这些干扰。基线校正有许多方法,其中一种被广泛应用的是曲线拟合法,它通过采用最小二乘法,根据拟合数据点和原始数据点的最小均方差达到拟合基线的目的,该方法简单,实时性好,但是在实际处理中,由于光谱混合了噪声,信号等信息,使得拟合的基线更易向强度大方向偏移。
[0003]本专利技术在上述背景之下,提出一种基于统计学的去除拉曼光谱基线的方法。该方法利用了统计学知识,成功缓解了曲线拟合中基线易向强度大方向偏移的问题,在实际使用中取得了良好的效果,为拉曼光谱去基线这一领域提供了一套可用的方法,具有十分重要的意义和价值。

技术实现思路

[0004]本专利技术的目的在于提供一种基于统计学的去除拉曼光谱基线的方法。
[0005]本专利技术的目的是这样实现的:
[0006]本专利技术包括如下步骤:
[0007](1),对拉曼光谱进行分段;
[0008](2),统计每段谱的方差并去掉方差大的谱后得到所需数据;
[0009](3),对剩余谱进行曲线拟合;
[0010](4),原谱数据减去拟合数据得到去除基线后的谱;
[0011]步骤(1)中,所述对拉曼光谱进行分段具体步骤如下:
[0012](1

1),设定分段大小n及步长s;
[0013](1

2),从光谱的第一个数据开始,计算往后数的n个数据作为第一段谱X1并记录;
[0014](1

3),从上一段谱的开始往后数s个数据作为新一段谱的开始,并以这段谱的开始为基准往后数n个作为新一段谱,当这段谱的数据量不足n个的时候,就以这段谱的开始到原始光谱的最末尾数据为这段谱的长度;
[0015](1

4),重复(1

3),直至光谱中所有数据都得到分段;
[0016]步骤(2)中,所述统计每段谱的方差并去掉方差大的谱具体步骤如下:
[0017](2

1),计算每段谱X
i
的方差σ
i
并记录;
[0018](2

2),以从小到大的顺序排列(2

1)中记录出来的方差σ
i
并去掉最后20%的方
差;
[0019](2

3),记录步骤(2

2)中没有去掉的方差所对应的数据;
[0020]步骤(3)中,所述对剩余谱进行曲线拟合是利用步骤(2

3)中的数据进行拟合。
[0021]相较于普通的曲线拟合,本专利技术所提出的方法的突出优点在于:
[0022](1),精度高:去除基线的效果更好。
附图说明
[0024]图1是本算法流程图。
[0025]图2是无基线的光谱图。
[0026]图3是有基线的光谱图。
[0027]图4是本专利技术去掉基线后的光谱图。
[0028]图5是仅用曲线拟合方法得到的去基线后的光谱图。
具体实施方式
[0029]下面结合附图对本专利技术做进一步的描述。
[0030]参照图1,对本专利技术的步骤做进一步的详细描述。
[0031]步骤(1),对拉曼光谱进行分段。
[0032]具体的,采用以下步骤对光谱进行分段:(1

1),首先设定分段大小n及步长s;(1

2),从光谱的第一个数据开始,计算往后数的n个数据作为第一段谱X1并记录;(1

3),从上一段谱的开始往后数s个数据作为新一段谱的开始,并以这段谱的开始为基准往后数n个作为新一段谱,当这段谱的数据量不足n个的时候,就以这段谱的开始到原始光谱的最末尾数据为这段谱的长度;(1

4),重复(1

3),直至光谱中所有数据都得到分段;优选的,将n与s都设定为5。
[0033]步骤(2),统计每段谱的方差并去掉方差大的谱后得到所需数据。
[0034]具体的,采用以下步骤获取所需数据:(2

1),计算每段谱X
i
的方差σ
i
并记录;(2

2),以从小到大的顺序排列(2

1)中记录出来的方差σ
i
并去掉最后20%的方差;(2

3),记录步骤(2

2)中没有去掉的方差所对应的数据。
[0035]步骤(3),对剩余谱进行曲线拟合,优选的,拟合方式采用多项式拟合。
[0036]步骤(4),原谱数据减去拟合数据得到去除基线后的谱。
[0037]具体的,用拟合曲线对原谱数据所对应的波数计算对应的强度作为基线数据,然后将原谱数据减去基线数据即去除基线后的谱。
[0038]为了对本专利技术的效果进行评估,采用均方根误差(RMSE)和相关系数(COR)对去基线效果进行评估。其中均方根误差(RMSE)越小代表效果越好,相关系数(COR)越大代表效果越好。
[0039]本专利技术与仅采用曲线拟合方法的性能比较见表1。
[0040]表1本专利技术与仅采用曲线拟合方法的评价结果评价指标本专利技术仅采用曲线拟合的方法均方根误差(RMSE)0.8130.858相关系数(COR)0.4730.461
[0041]由表1的统计结果可知,本专利技术相对于仅采用曲线拟合的方法均方根误差(RMSE)更小,且相关系数(COR)更大,可见,本专利技术能有效改进去基线的效果。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于统计学的去除拉曼光谱基线的方法,包括如下步骤:(1),对拉曼光谱进行分段;(2),统计每段谱的方差并去掉方差大的谱后得到所需数据;(3),对剩余谱进行曲线拟合;(4),原谱数据减去拟合数据得到去除基线后的谱;步骤(1)中,所述对拉曼光谱进行分段具体步骤如下:(1

1),设定分段大小n及步长s;(1

2),从光谱的第一个数据开始,计算往后数的n个数据作为第一段谱X1并记录;(1

3),从上一段谱的开始往后数s个数据作为新一段谱的开始,并以这段谱的开始为基准往后数n个作为新一段谱,当这段谱的数据量不足n个的时候,就以这段谱的开始到原始光谱的最末尾数据为这段谱的长度;(1
‑<...

【专利技术属性】
技术研发人员:苑立波陆晟祺杨世泰
申请(专利权)人:南宁桂电电子科技研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1