System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于无监督式学习的拉曼光谱去噪方法技术_技高网
当前位置: 首页 > 专利查询>南昌大学专利>正文

一种基于无监督式学习的拉曼光谱去噪方法技术

技术编号:40909810 阅读:3 留言:0更新日期:2024-04-18 14:39
本发明专利技术提供一种基于无监督式学习的拉曼光谱去噪方法,不同于有监督式学习的去噪方法,本方法采用无监督式学习,无需样本数据,可以提高光谱采集速率,更易于对激光敏感的样品、具有生物活性的样品的采集。本发明专利技术提出的一种基于无监督式学习的拉曼光谱去噪方法,包括以下步骤:生成训练集、验证集和测试集数据;构建由U‑net和LSTM所组成的网络模型;通过训练集数据对模型进行训练,生成预训练模型;由验证集验证模型的准确性;将测试集数据输入模型中得到去噪后的拉曼光谱。本方法可以为定量分析提高数据质量、增加分析精度、增强信号特征、提高灵敏度。

【技术实现步骤摘要】

本专利技术涉及光学领域以及人工智能领域,具体是指一种基于无监督式学习的拉曼光谱去噪方法


技术介绍

0、技术背景

1、拉曼光谱是一种散射光谱。拉曼光谱分析法是基于印度科学家所发现的拉曼散射效应,对与入射光频率不同的散射光谱进行分析以得到分子振动、转动方面信息,并应用于分子结构研究的一种分析方法。拉曼光谱是研究物质物理化学性质的最广泛的分析方法之一,常用于化学或生物样品等材料的定性或是非侵入性的定量表征。

2、拉曼散射具有信号较弱的固有属性,之后出现许多信号增强方法,但是因为用于探测拉曼光谱的仪器自身仍仪器本身存在不可忽视噪声(在低信噪比情况下,噪声主要由ccd的读出噪声贡献),考虑到细胞、石墨烯等脆弱样本在高激光功率下容易损坏,这些仪器噪声在拉曼扫描表征细胞、石墨烯等脆弱样本过程中尤为明显。

3、目前对拉曼光谱进行去噪的方法大致分为两类:第一类是传统的去噪方法,例如基于平滑的算法的savitzky-golay;基于频率的算法,如小波变换;基于先验知识的方法,例如维纳估计;以及基于降维的方法,例如主成分分析、奇异值分解等。以上方法都存在去噪效果差的问题。第二类是基于深度学习的方法,其相比于传统算法通常具有更好的去噪能力。然而,仍属于基于先验知识的有监督学习,虽然他们普遍具有良好的去噪效果,但是,存在泛化性低,干净数据难以获取等问题。

4、鉴于当前去噪技术中存在的诸多问题,本专利技术提出一种基于无监督式学习的拉曼光谱去噪方法,该方法基于noise2noise去噪原理,无需采集干净光谱,只需采集无待测样本状态下光谱仪的高斯读出噪声数据作为训练集,能够克服当前技术缺陷,以对拉曼光谱实现快速、高效、精准的去噪。


技术实现思路

1、本专利技术的目的如下所述:(1)解决目前传统去噪方法难以实现精准去噪的问题;(2)解决目前监督式学习存在泛化性差,需要花费大量资源去采集干净光谱的问题;(3)对激光敏感的物质采集时加重了(2)所述的问题。

2、本
技术实现思路
方案是一种基于无监督式学习的拉曼光谱去噪方法,其具体
技术实现思路
包括:

3、一种基于noise2noise的无监督式学习拉曼光谱去噪方法,包括以下具体步骤:

4、步骤1:通过福格特u函数生成不同模拟特征峰,将不同特征峰通过排列组合在不同波数上,生成模拟拉曼光谱组;将模拟拉曼光谱组与不同浓度系数组相乘,快速得到大量的数据,将其分为训练集数据、验证集数据;将得到的模拟光谱进行矢量归一化处理,使其强度值在0到1内;再向上述干净拉曼光谱中叠加光谱仪实际采集的高斯读出噪声;通过neighbor2neighbor的方式将单张带噪声的光谱生成两个张带噪声的光谱对;通过上述步骤生成训练集、验证集数据库;

5、步骤2:建立无监督式深度学习模型,模型由两部分组成,第一部分为residualunet结构,包括下采样层、上采样层,下采样层通过卷积提取光谱的特征,上采样层通过反卷积还原出无噪声的光谱;第二部分为lstm结构,分析光谱之间的隐藏关系,通过学习这种关系来去除噪声;

6、步骤3:根据无监督式学习noise2noise的原理,使用步骤1所生成的成对的噪声训练集数据用于对步骤2的模型训练,得到预训练模型;

7、步骤4:对模型结构或超参数进行修改,循环修正模型得到最终预训练模型;

8、步骤5:利用步骤1中的光谱仪采集真实拉曼光谱数据,使用步骤4的预训练模型对其进行去噪,得到去噪光谱;

9、上述方案中,步骤1中矢量归一化处理的计算公式如下:

10、

11、其中yi为合成的干净光谱,yi′为归一化后的干净光谱,t为波数个数;

12、上述方案中,步骤1中生成模拟训练集数据和验证集数据由以下公式生成:

13、模拟光谱组合矩阵p表示如下:

14、

15、其中,pi代表第i个不同的模拟光谱数据,t为光谱的波数个数,m为共有m条光谱数据;

16、浓度系数c组成的矩阵如下:

17、

18、其中c为浓度系数矩阵,cji代表第j组拉曼光谱组所对应的浓度组合,浓度组合中的第i个浓度值与拉曼光谱组合矩阵p中的光谱pi相对应,n为共有n组浓度组合,m为每组浓度个数对应m条光谱数据;

19、合成的干净光谱数据如下:

20、s=c×p

21、其中s为组合后的干净光谱数据,一共有n条组合光谱数据。

22、上述方案中,步骤1,在干净光谱中叠加仪器的读出噪声,叠加噪声后的光谱信噪比计算公式如下:

23、

24、其中s为信号均值,σ为噪声的标准差。

25、上诉方案中,步骤1,通过neighbor2neighbor的方法将单张带噪声的光谱生成两张相似但不相同的成对光谱,在相邻但不相同的位置采样出子图以此来满足相互之间相似但不相同的条件。

26、其中,y为含噪声数据,g1(y),g2(y)为采样两次得到噪声光谱对,fθ为去噪网络。

27、上述方案中,步骤2,建立的模型由resunet和lstm两部分组成,具体组成结构参数如下:

28、第一部分resunet结构,其中有5个下采样过程和5个上采样过程,残差(residual)结构中,输入先做一次卷积,得到x,再经过三次卷积过程得到f(x),最终相加得到输出x+f(x),以此为子结构构建unet网络结构。上采样与下采样之间包含5次层与层之间的操作,具体操作为特征的复制与拼接(copy&joint)。

29、第二部分为lstm结构,共有31个lstm单元组成,通过输入下采样得到的特征,学习特征之间的隐藏关系,达到去噪效果。

30、上述方案中,步骤3,noise2noise无监督式学习用于拉曼光谱去噪的原理可由以下公式说明:

31、

32、其中是低信噪比的拉曼光谱数据,是成对的低信噪比的拉曼光谱数据,l为损失函数,fθ为去噪网络。

33、由neighbor2neighbor的方法将noise2noise的损失函数最终改写为如下公式:

34、

35、其中,y为含噪声数据,g1(y),g2(y)为采样两次得到噪声对,fθ为去噪网络。

36、该专利技术旨在实现以下效果:首先,解决目前传统去噪方法在处理复杂光谱数据时难以实现精准去噪的问题。通过创新性的技术手段,该专利技术旨在提供更为准确和可靠的去噪解决方案,以应对传统方法在处理复杂噪声时的局限性。

37、其次,改进监督式学习在去噪领域的泛化性能,以减少对大量干净光谱数据的依赖性。通过采用新颖的方法,该专利技术旨在提高去噪模型的普适性,使其能够更有效地应对各种光谱数据的去噪需求,同时减少对昂贵、繁琐数据收集过程的依赖。

38、最后,针对激光敏感物质采集时可能面临的挑战,该专利技术通过创新性设计旨在提本文档来自技高网...

【技术保护点】

1.一种基于无监督式学习的拉曼光谱去噪方法,其特征在于,包括以下几个步骤:

2.根据权利要求1所述的一种基于无监督式学习的拉曼光谱去噪方法,其特征在于,步骤1中,生成训练集、验证集数据库具体步骤如下:

3.根据权利要求2所述的一种基于无监督式学习的拉曼光谱去噪方法,其特征在于,步骤2中,建立无监督式深度学习模型,模型由两部分组成,第一部分为Residual Unet结构,包括下采样层、上采样层;有5个下采样过程,每次下采样之前经过一个残差结构,下采样层通过卷积提取光谱的特征;5个上采样过程,每次上采样之后经过一个残差结构,上采样层通过反卷积还原出无噪声的光谱,最后经过一次一维卷积,将通道数还原为1。

4.根据权利要求3所述的一种基于无监督式学习的拉曼光谱去噪方法,其特征在于,步骤2中,残差结构块为,输入先经过一次一维卷积、BatchNorm和PreLU,之后再与经过三次一维卷积、BatchNorm和PreLU的值相加,最终得到输出。

5.根据权利要求4所述的一种基于无监督式学习的拉曼光谱去噪方法,其特征在于,步骤2中,建立无监督式深度学习模型,第二部分为LSTM结构,LSTM结构放在模型最底层,分析光谱之间的隐藏关系,通过学习这种关系来去除噪声。

6.根据权利要求5所述的一种基于无监督式学习的拉曼光谱去噪方法,其特征在于,步骤2中,建立无监督式深度学习模型,上采样与下采样之间包含四次层与层之间的操作,具体操作为特征的复制与拼接。

...

【技术特征摘要】

1.一种基于无监督式学习的拉曼光谱去噪方法,其特征在于,包括以下几个步骤:

2.根据权利要求1所述的一种基于无监督式学习的拉曼光谱去噪方法,其特征在于,步骤1中,生成训练集、验证集数据库具体步骤如下:

3.根据权利要求2所述的一种基于无监督式学习的拉曼光谱去噪方法,其特征在于,步骤2中,建立无监督式深度学习模型,模型由两部分组成,第一部分为residual unet结构,包括下采样层、上采样层;有5个下采样过程,每次下采样之前经过一个残差结构,下采样层通过卷积提取光谱的特征;5个上采样过程,每次上采样之后经过一个残差结构,上采样层通过反卷积还原出无噪声的光谱,最后经过一次一维卷积,将通道数还原为1。

4.根据权...

【专利技术属性】
技术研发人员:戴一川万谋群陈建锋陈笑笑李小兵许文虎
申请(专利权)人:南昌大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1