一种基于深度学习的拉曼光谱去噪方法技术

技术编号:33293878 阅读:11 留言:0更新日期:2022-05-01 00:18
本发明专利技术提供一种基于深度学习的拉曼光谱去噪方法,解决现有技术中去噪的过程中容易丢失纯拉曼光谱信息,同时还依靠人为干预来设定输入参数。本发明专利技术提出一种基于深度学习的网络的拉曼光谱去噪方法,包括以下步骤:生成模型训练所需的拉曼光谱数据,分为训练集、验证集以及测试集;然后建立U

【技术实现步骤摘要】
一种基于深度学习的拉曼光谱去噪方法


[0001]本专利技术涉及光学领域,尤其涉及光学检测
,具体是指一种基于深度学习的拉曼光谱去噪方法。

技术介绍

[0002]拉曼光谱法是上世纪20年代由印度科学家拉曼提出来的一项技术。上世纪六十年代激光器的诞生,给拉曼光谱的应用带来了发展空间。拉曼光谱分析技术由于具有丰富的物质特性信息、无损检验、无需样品制备等优点,作为一种行之有效的检测分析方法目前已被广泛应用。
[0003]拉曼光谱是一种由物质的分子振动产生的非弹性散射光谱,能够对物质做定性与定量分析,因而在医疗、化工等诸多领域得到广泛的应用。由于拉曼光谱是一种极其敏感的光谱,极易受到噪音和荧光背景的影响,在分析前需预先对光谱进行去噪处理。
[0004]目前对拉曼光谱进行去噪的主要方法有Savitzky

Golay平滑滤波、FFT滤波、惩罚最小二乘(PLS)、阈值法小波去噪。但目前的方法在去噪的过程中容易丢失纯拉曼光谱信息,同时还依靠人为干预来设定输入参数,不同物质的拉曼光谱需要设定不同的输入参数,并且人为设定的参数很难得到最优的去噪效果。这是拉曼光谱术应用于光学检测领域的一大难题。
[0005]鉴于现有技术中存在的缺陷,本专利技术提出一种基于深度学习的拉曼光谱去噪方法,实现对拉曼光谱精准高效去噪。

技术实现思路

[0006]本专利技术的目的包括两个:(1)解决目前方法无法精准高效对拉曼光谱进行去噪的问题;(2)解决目前方法无法自动设定去噪参数的问题。基于以上两个目的,本专利技术提供一种基于深度学习的拉曼光谱去噪方法。
[0007]为了实现上述目的,本专利技术采用的技术方案如下:
[0008]一种基于深度学习的拉曼光谱去噪方法,包括以下几个步骤:
[0009]步骤1:利用洛伦兹剖面对纯净拉曼光谱特征峰进行拟合,使用泊松噪音和高斯噪音拟合噪音信号,建立由训练集、验证集、测试集组成的拉曼光谱数据库;
[0010]步骤2:构建深度学习模型,模型整体由编码器结构和解码器结构组成,编码器结构接收原始拉曼光谱并使用卷积神经网络提取光谱特征信息,解码器结构负责将编码器提取的特征信息重构成与原始拉曼光谱尺寸相同的纯净光谱;
[0011]步骤4:使用训练集训练深度学习模型,包括编码器网络和解码器网络;
[0012]步骤5:使用测试集测试改进深度学习模型性能,然后使用模型对拉曼光谱进行去噪,并输出纯净拉曼光谱数据。
[0013]上述方案中,步骤1,生成纯净光谱数据和带有噪音的模拟拉曼光谱的具体步骤如下:
[0014]步骤11:本专利技术使用模拟拉曼光谱对模型进行训练,每条模拟拉曼光谱数据由下方公式组成:
[0015]r(x
i
)=R(x
i
)+N(x
i
)
[0016]其中x
i
代表拉曼频移,r(x
i
)代表生成的模拟拉曼光谱、R(x
i
)代表纯净拉曼光谱、N(x
i
)代表噪音光谱,模拟拉曼光谱数据r(x
i
)由二者叠加而成。
[0017]上述方案中,步骤12:使用洛伦兹剖面对纯净拉曼光谱特征峰进行拟合,拟合公式如下:
[0018][0019]模拟的纯净拉曼光谱数据由m个洛伦兹峰组成,m个洛伦兹峰具有不同的振幅A
n
、宽度σ
n
并以不同的变量x
n
为中心。
[0020]上述方案中,步骤13:拉曼光谱噪音包括泊松噪音(散粒噪音和热噪音)和高斯噪音(读出噪音)。因此拉曼光谱噪音数据通过下列公式生成:
[0021][0022]其中n
ph
(x
i
)为散粒噪音、n
th
为热噪音、n
rd
为读出噪音;e(x
i
)是标准差为1且平均值为0的高斯噪音。
[0023]上述方案中,散粒噪音可通过下列公式进行模拟:
[0024][0025]散粒噪音是纯净光谱R(x
i
)的平方根,当变量x
i
对应的R(x
i
)越大时,散粒噪音也越大。有x
i
没有对应的信号特征时则没有散粒噪音。
[0026]上述方案中,热噪音可通过下列公式进行模拟:
[0027][0028]热噪音可以由热背景B的平方根进行模拟,热背景为x
i
上的常数。并且读出噪音也可被视为x
i
上的常数;
[0029]n
rd
=c。
[0030]上述方案中,步骤14:在步骤13的基础上模拟大量具有不同信噪比(SNR)的模拟拉曼光谱数据,生成的模拟光谱信噪比计算公式如下所示:
[0031][0032]上述方案中,步骤2中建立的由编码器结构和解码器结构组成深度学习模型具体步骤如下:
[0033]步骤21:编码器部分用于对拉曼光谱进行特征提取,它使用经典的VGG16网络结构,一共包括五个特征提取层;
[0034]前两层每层包含两次3
×
1的卷积处理,以及一次2
×
1的最大池化处理。第三层、第四层则包含三次3
×
1卷积处理和一次最大池化处理,最后一层仅有三次3
×
1卷积处理,无最大池化处理;
[0035]每次卷积处理均包含批处理以及ReLU激活函数。
[0036]上述方案中,步骤22:在步骤21基础上构建解码器部分,解码器部分将编码器部分提取出的特征信息进行重构以获得等尺寸的纯净拉曼光谱,它包含四次操作,每次操作包含一次上采样(Up

sampling)处理、一次特征融合(Copy and crop)以及两次3
×
1的卷积处理;
[0037]特征图首先经上采样处理后尺寸缩小为原来的一半,然后与编码器部分对应的卷积层进行特征融合处理,最后再进行两次带有ReLU激活函数的卷积处理;在解码器末尾是一层无激活函数的1
×
1卷积层,用于输出重构后的纯净光谱。
[0038]本专利技术通过搭建深度学习模型,对拉曼光谱进行去噪,解决了目前方法依赖人工设置参数、不便捷、不高效等缺点,本专利技术具有以下优点:
[0039]1、本专利技术的基于深度机器学习模型实现对拉曼光谱数据去噪的方法,使用大量不同的拉曼光谱数据进行训练,使模型具有更强的泛化能力和鲁棒性,可自动对不同物质的拉曼光谱信号进行去噪,无需人工干预设定参数。
[0040]2、本专利技术使用了编码器网络与解码器网络构成的U形结构,这种U形结构可对拉曼光谱数据进行去噪的同时最大程度的保留拉曼光谱本身携带的信息,而以往方法在去噪的过程中容易丢失光谱本身携带的信息,相较于传统方法,本专利技术更加高效且精确。
[0041]3、本专利技术针对拉曼光本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的拉曼光谱去噪方法,其特征在于,包括以下几个步骤:步骤1:利用洛伦兹剖面对纯净拉曼光谱特征峰进行拟合,使用泊松噪音和高斯噪音拟合噪音信号,建立由训练集、验证集、测试集组成的拉曼光谱数据库;步骤2:构建深度学习模型,模型整体由编码器结构和解码器结构组成,编码器结构接收原始拉曼光谱并使用卷积神经网络提取光谱特征信息,解码器结构负责将编码器提取的特征信息重构成与原始拉曼光谱尺寸相同的纯净光谱;步骤4:使用训练集训练深度学习模型,包括编码器网络和解码器网络;步骤5:使用测试集测试改进深度学习模型性能,然后使用模型对拉曼光谱进行去噪,并输出纯净拉曼光谱数据。2.根据权利要求1所述的一种基于深度学习的拉曼光谱去噪方法,其特征在于,步骤1中,生成纯净光谱数据和带有噪音的模拟拉曼光谱的具体步骤如下:步骤11:本发明使用模拟拉曼光谱对模型进行训练,每条模拟拉曼光谱数据由下方公式组成:r(x
i
)=R(x
i
)+N(x
i
)其中x
i
代表拉曼频移,r(x
i
)代表生成的模拟拉曼光谱、R(x
i
)代表纯净拉曼光谱、N(x
i
)代表噪音光谱,模拟拉曼光谱数据r(x
i
)由二者叠加而成。3.根据权利要求2所述的一种基于深度学习的拉曼光谱去噪方法,其特征在于,还包括,步骤12:使用洛伦兹剖面对纯净拉曼光谱特征峰进行拟合,拟合公式如下:模拟的纯净拉曼光谱数据由m个洛伦兹峰组成,m个洛伦兹峰具有不同的振幅A
n
、宽度σ
n
并以不同的变量x
n
为中心。4.根据权利要求3所述的一种基于深度学习的拉曼光谱去噪方法,其特征在于,还包括,步骤13:拉曼光谱噪音包括泊松噪音和高斯噪音(读出噪音),因此拉曼光谱噪音数据通过下列公式生成:其中n
ph
(x
i
)为散粒噪音、n
th
为热噪音、n
rd
为读出噪音;e(x
i
)是标准差为1且平均值为0的高斯噪音。5.根据权利要求4所述的...

【专利技术属性】
技术研发人员:谷永辉刘昌军
申请(专利权)人:山东捷讯通信技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1