基于DRS-VGG的端到端深度学习拉曼光谱数据分类方法技术

技术编号:34017198 阅读:16 留言:0更新日期:2022-07-02 16:03
本发明专利技术公开一种基于Deep Residual Shrinkage

【技术实现步骤摘要】
基于DRS

VGG的端到端深度学习拉曼光谱数据分类方法


[0001]本专利技术涉及拉曼光谱数据分类领域,具体涉及一种基于Deep Residual Shrinkage

VGG的端到端深度学习拉曼光谱数据分类方法。

技术介绍

[0002]拉曼光谱是一种振动光谱,在分析科学领域中为我们提供了一种具有快速、灵敏、非接触性、非破坏性特点的检测方法,它通过材料对入射光源中产生的拉曼散射进行材料的结构分析。拉曼光谱适用于不同温度下气体、液体、固体的定性定量分析,因此,在医疗领域、食品科学领域、法医学领域、地质学领域实现了广泛应用。
[0003]拉曼光谱信号中包含的信息是分析的关键。由于拉曼信号容易受到荧光过程、材料密度、环境噪声、外部光源的影响,光谱会出现基线漂移的现象和受到噪声信号的干扰,噪声信号强度可比拉曼散射高出几个数量级,严重影响光谱的分析。由于这些限制因素的存在,传统的拉曼光谱分析过程通常需要通过去噪、平滑、基线消除、归一化等数据预处理。许多传统的机器学习方法已经被应用于对目标物的定性定量分析。支持向量机(Support Vector Machine,SVM)、K近邻(K

Nearest Neighbor,KNN)、随机森林(Random Forest,RF)、逻辑斯蒂回归(Logistic Regression,LR)算法是几种简单有效的分类器,然而这些算法容易在小样本、类不均衡、高噪声数据的场景上出现过拟合的问题,且无法构造无需预处理的端到端的数据分类模型。
[0004]近年来,深度学习算法也逐渐被应用到光谱数据的自动化分析方面,它的目的在于用抽象的方法不断从低级特征向量中提取重要特征。相比之下,深度学习算法是更为优异的选择方案,它在光谱识别的任务中拥有着如下两大优点:(1)不仅能识别相关特征,还能学习识别模式和知识。(2)相比于机器学习算法拥有更良好的分类结果。就总体而言,目前拉曼光谱识别研究过渡依赖于特征工程,注重采用数据增强手段实现识别正确率的提升,较少考虑模型性能与训练时间成本之间的权衡。我们认为构造一种能够自动处理数据、训练速度快、精度高的端到端分类模型是解析和理解光谱信息不可缺少的手段。

技术实现思路

[0005]本专利技术的目的在于,提出一种基于DRS(Deep Residual Shrinkage)

VGG的端到端深度学习拉曼光谱数据分类方法,利用深度学习方法取代了传统的通过预处理的方案,实现了富含干扰信息的多类别的拉曼光谱数据的识别,且达到了深度学习网络模型性能与训练时间成本之间的权衡。
[0006]本专利技术的技术方案为:
[0007]一种基于Deep Residual Shrinkage

VGG的端到端深度学习拉曼光谱数据分类方法,包括以下步骤:
[0008]步骤1,获取拉曼光谱数据,进行一阶样条插值处理,将超出原光谱波数范围的插值点补零,将处理后的拉曼光谱数据随机打乱后划分成训练集、验证集和测试集;
[0009]步骤2,构建一个基于Deep Residual Shrinkage

VGG的端到端深度学习的分类模型;
[0010]步骤3,使用训练集训练基于Deep Residual Shrinkage

VGG的端到端深度学习的分类模型,使用验证集对模型的超参数进行调整,初步评估模型的性能;
[0011]步骤4,使用测试集测试基于Deep Residual Shrinkage

VGG的端到端深度学习的分类模型性能。
[0012]步骤1中,获取拉曼光谱数据,进行一阶样条插值处理,具体包括:采用式(1)对拉曼光谱数据进行一阶样条插值处理,由于采样条件不同,各样本不处于同一波数范围,需要通过插值处理使得数据尺寸达到一致。由指定波数值求得对应光谱强度值,使得每个拉曼光谱在指定波数范围内均匀采样:
[0013][0014]式中,x
i
‑1和x
i+1
为插值前的某个分段区间左右端点拉曼光谱数据波数值;y
i
‑1和y
i+1
为插值前的该分段区间左右端点拉曼光谱数据强度值;X
i
为该区间插值后的拉曼光谱数据波数值;Y
i
为该区间插值后的拉曼光谱数据强度值;
[0015]将超出原光谱波数范围的插值点补零,具体包括:若给定插值区间大于原拉曼光谱数据的波数范围,在原拉曼光谱数据的波数范围内进行一阶样条插值后,在超出在原拉曼光谱数据的波数范围用数值0补齐范围外插值数据的强度值;
[0016]将处理后的拉曼光谱数据随机打乱后划分成训练集、验证集和测试集,具体包括:将随机打乱后的拉曼光谱数据的30%划分为测试集,在划分过程中将数据按原数据集中各标签的比例传递,使得样本分布相同;采取同样的划分策略,将剩下数据的80%划分为训练集,将剩下数据的20%划分为验证集。
[0017]步骤2中,构建一个基于Deep Residual Shrinkage

VGG的端到端深度学习的分类模型,具体包括:
[0018]构建的基于Deep Residual Shrinkage

VGG的端到端深度学习的分类模型依次由两个卷积模块、三个DRS模块、两个全连接模块和Softmax输出层构成;
[0019]卷积模块依次由卷积层、ReLU激活函数、卷积层、ReLU激活函数、最大池化层连接构成;
[0020]DRS模块由卷积层、ReLU激活函数、全局平均池化层、全连接层、批标准化层、Sigmoid激活函数、最大池化层相组合构成;模块的主体是四个依次连接的卷积层,在主体的不同阶段加入了两个分支;在一分支中加入了恒等映射,在参数反向传播的过程中使得梯度可以更加有效地流回上层以减轻卷积神经网络的训练难度;在另一分支中借助了注意力机制来自动实现了特征的软阈值化,它的主要功能是将绝对值小于某个阈值的特征消除为0,同时其它的特征也向着0进行调整,表示为:
[0021][0022]式中,代表了软阈值化后的第i个通道的第j个强度值;z
ij
代表未经处理前第i个通道的第j个强度值;λ
i
代表经过全局平均池化层后第i个强度值;w
i
代表经过Sigmoid激活函数后的第i个强度值,它代表了的λ
i
权重,λ
i
与w
i
的相乘代表了每一层通道所对应的阈
值;
[0023]将DRS模块的输出展开作为全连接层的输入;全连接模块依次由全连接层、批标准化层、ReLU激活函数、丢弃率为0.5的Dropout层连接构成;
[0024]将全连接模块的输出作为Softmax输出层的输入,通过Sotfmax输出层获得概率分布形式的分类预测结果。
[0025本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Deep Residual Shrinkage

VGG的端到端深度学习拉曼光谱数据分类方法,包括以下步骤:步骤1,获取拉曼光谱数据,进行一阶样条插值处理,将超出原光谱波数范围的插值点补零,将处理后的拉曼光谱数据随机打乱后划分成训练集、验证集和测试集;步骤2,构建一个基于Deep Residual Shrinkage

VGG的端到端深度学习的分类模型;步骤3,使用训练集训练基于Deep Residual Shrinkage

VGG的端到端深度学习的分类模型,使用验证集对模型的超参数进行调整,初步评估模型的性能;步骤4,使用测试集测试基于Deep Residual Shrinkage

VGG的端到端深度学习的分类模型性能。2.根据权利要求1所述的基于Deep Residual Shrinkage

VGG的端到端深度学习的拉曼光谱数据分类方法,其特征在于,步骤1中,进行一阶样条插值处理,具体包括:采用式(1)对拉曼光谱数据进行一阶样条插值处理,由指定波数值求得对应光谱强度值,使得每个拉曼光谱在指定波数范围内均匀采样:式中,x
i
‑1和x
i+1
为插值前的某个分段区间左右端点拉曼光谱数据波数值;y
i
‑1和y
i+1
为插值前的该分段区间左右端点拉曼光谱数据强度值;X
i
为该区间插值后的拉曼光谱数据波数值;Y
i
为该区间插值后的拉曼光谱数据强度值。3.根据权利要求1所述的基于Deep Residual Shrinkage

VGG的端到端深度学习的拉曼光谱数据分类方法,其特征在于,步骤1中,将超出原光谱波数范围的插值点补零,具体包括:若给定插值区间大于原拉曼光谱数据的波数范围,在原拉曼光谱数据的波数范围内进行一阶样条插值后,在超出在原拉曼光谱数据的波数范围用数值0补齐范围外插值数据的强度值。4.根据权利要求1所述的基于Deep Residual Shri...

【专利技术属性】
技术研发人员:周猛飞胡寅朝郭添余奇清孙小方蔡亦军
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1