一种基于深度学习的拉曼光谱大米检测方法技术

技术编号:38159943 阅读:10 留言:0更新日期:2023-07-13 09:31
本发明专利技术涉及大米检测技术领域,且公开了一种基于深度学习的拉曼光谱大米检测方法,包括如下步骤:步骤一:样本收集;步骤二:数据收集;步骤三:数据处理,采用airPLS算法对采集的所有拉曼光谱进行预处理操作并制作新的数据集;利用PCA对数据预处理;通过使用Origin 2018Pro的PACA软件包对拉曼光谱数据集进行了主成分分析;步骤四:深度学习模型建模;步骤五:模型训练与评价。该基于深度学习的拉曼光谱大米检测方法,通过对原始拉曼光谱进行预处理,以拉曼光谱为技术手段,结合深度学习,实现了对不同地区大米的快速、有效识别。对比传统的识别方法,本研究在拉曼光谱极度相似的情况下仍可以对大米类别进行准确识别。下仍可以对大米类别进行准确识别。下仍可以对大米类别进行准确识别。

【技术实现步骤摘要】
一种基于深度学习的拉曼光谱大米检测方法


[0001]本专利技术涉及大米检测
,具体为一种基于深度学习的拉曼光谱大米检测方法。

技术介绍

[0002]大米是世界上最重要的谷物粮食作物之一,不仅是中国人的传统主食,更是世界一半以上人口的主食。因品种、产地、生长条件的不同,大米的营养成分含量存在很大的差别。近年来,由于人们对大米的营养价值和口感品质的追求不断提高,市场上出现了非优质大米冒充优质大米、以次充好、品牌冒充、产地冒充等现象,严重损害了消费者利益。而中国大米种植区域广泛、品种繁多,因此市场监管困难。传统的鉴别方法主要包括感官检测及化学检测,主观性强并且过程复杂,不能满足市场监管中快速判别的需求。
[0003]大米鉴别技术在目前全球面临粮食危机的环境中很重要,而拉曼光谱是一种能够解决该问题的有效手段。传统的基于机器学习的拉曼光谱大米检测方法需要大量的参考数据库,且在当不同大米之间的拉曼光谱相似,特征峰分辨率不高,难以通过机器学习建立模型;
[0004]本文提出了以拉曼光谱为技术手段,结合深度学习,建立快速识别不同产地大米模型的方法。通过对南北方2个产地共400份大米样品的光谱数据进行采集,然后用airPLS算法对拉曼光谱数据进行预处理,对处理之后的一维数据通过数据输入维度的不同搭建了两种不同的卷积神经网络模型,分别为R

S

1D模型和R

S

2D模型,通过深度学习模型预测未知产地大米的识别准确率为92.7%,AUC值为0.920,能实现在数据较少且特征峰分辨率较低的情况下无损、快速的对大米进行鉴别的目标。

技术实现思路

[0005](一)解决的技术问题
[0006]针对现有技术的不足,本专利技术提供了一种基于深度学习的拉曼光谱大米检测方法,利用深度学习结合拉曼光谱在鉴别大米产地的方面具有良好的应用前景,对比传统的机器学习鉴别方法具有更加高效,便捷,简单、高适用性和高分辨率等优点。
[0007](二)技术方案
[0008]为实现上述目的,本专利技术提供如下技术方案:
[0009]一种基于深度学习的拉曼光谱大米检测方法,包括如下步骤:
[0010]步骤一:样本收集:将收集的样品分容器放置,贴上标签,并在容器中用去离子水将大米冲洗干净,最后将样品自然晾干;
[0011]步骤二:数据收集,使用便携式拉曼光谱仪,扫描范围为0~2000cm
‑1,扫描时间为5000ms,扫描光强为100;测试条件为室温,样品采集时先进行暗电流的去除;
[0012]将大米置于黑暗密闭环境进行检测,通过BWSpec4软件连接拉曼光谱仪将不同品种的大米测出的拉曼光谱分开进行储存;
[0013]最后通过删除重复数据制作成具有两个标签的拉曼光谱数据集;
[0014]步骤三:数据处理,采用airPLS算法对采集的所有拉曼光谱进行预处理操作并制作新的数据集;利用PCA对数据预处理;通过使用Origin 2018Pro的PACA软件包对拉曼光谱数据集进行了主成分分析;
[0015]步骤四:深度学习模型建模,通过制备的拉曼光谱数据集在TensorFlow2.0框架下通过不同的维度输入建立了两种深度学习模型,分别为R

S

1D模型和R

S

2D模型,验证了通过深度学习建立模型可以有效的对不同地区大米进行检测分类;
[0016]步骤五:模型训练与评价,在对拉曼光谱数据进行了预处理之后,选择数据集中80%的数据作为训练集,20%的数据作为测试集;在训练过程中仅使用训练集来训练模型,而不使用独立的测试集进行训练;
[0017]对于分类模型,混淆矩阵和ROC曲线以及ROC曲线下的AUC值常被作为模型的评估指标。
[0018]优选的,所述步骤二中,在测量拉曼光谱的过程中每个样品重复扫描三次,检测时统一将镜头对准大米中心部位,以消除样品不均匀性带来的干扰。
[0019]优选的,所述步骤三中,airPLS算法以惩罚最小二乘法为基础,在迭代过程中,通过自适应调整拟合基线与原始信号之间残差平方和的权重,高效精准找到并扣除不规则变化的基线;在该算法中,z为长度为l的拟合信号,x为真实信号,拟合信号和真实信号的关系可用如下表述:
[0020][0021][0022][0023]式中,F为信号的拟合精确度,R为拟合信号z的粗糙度,Q为精确度与粗糙度之间的平衡;
[0024]通过求取时的解,即可得到平滑后的信号;而自适应迭代重加权惩罚最小二乘法是在此基础上,通过对精确度F施加权重w,保证使得峰所在位置的权重为0的情况下,基线所在位置的权重不为0,然后进行自动更新权重的迭代;对第t次迭代,其精确度与粗糙度之间的平衡可以表示为:
[0025][0026]其中,
[0027][0028]在迭代过程中,通过设定收敛准则或者最大收敛次数来控制程序的迭代次数,当程序终止计算,返回权重w和拟合基线z。
[0029]优选的,所述步骤四中R

S模型的输入为一维数据输入,通过卷积层,池化层,全连接层输出。
[0030]优选的,所述步骤四中R

S

2D模型的输入为矩阵输入,数据输入之后先将一维数据转化为二维矩阵,然后经过两个卷积层(Convolution),确定输入通道的数量、卷积核大小以及步长长度。接着连接一个最大池化层(Max Pool)进行数据降维,之后在通过卷积层和最大池化层对数据进行两次的卷积和池化,再连接一个展平层(Flatten Layers)和一个全连接层(Fully Connected Layers,FC),最后输出分类结果。
[0031]优选的,所述步骤五中,评价指标主要是准确率、精确率、召回率和F

Scorce,AUC值被定义为ROC曲线下的面积,在本实验中被用来作为衡量模型的综合评价指标。
[0032]优选的,所述步骤五中,通过批量归一化处理(BN)来防止梯度下降和过拟合问题,BN公式入下:
[0033][0034][0035]z
(i)
是一个批次中的第i个输入值,是一个批次中第i个输入实例的零中心和归一化后的值,添加ε是为了避免除法中分母为零的错误,为最终得到的处理结果,γ和β是可训练的超参数;
[0036]其中:
[0037][0038][0039]m
B
为每个批次中的样本数量。
[0040]在损失函数方面选择的sparse_categorical_crossentropy函数公式入下:
[0041][0042]其中,x
i
表示第i个输入值,y
i
表示第i个输入值对应的输出,m表示样本数量,f表示对应的激活函数。
[0043](三)有益效果
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的拉曼光谱大米检测方法,其特征在于,包括如下步骤:步骤一:样本收集:将收集的样品分容器放置,贴上标签,并在容器中用去离子水将大米冲洗干净,最后将样品自然晾干;步骤二:数据收集,使用便携式拉曼光谱仪,扫描范围为0~2000cm
‑1,扫描时间为5000ms,扫描光强为100;测试条件为室温,样品采集时先进行暗电流的去除;将大米置于黑暗密闭环境进行检测,通过BWSpec4软件连接拉曼光谱仪将不同品种的大米测出的拉曼光谱分开进行储存;最后通过删除重复数据制作成具有两个标签的拉曼光谱数据集;步骤三:数据处理,采用airPLS算法对采集的所有拉曼光谱进行预处理操作并制作新的数据集;利用PCA对数据预处理;通过使用Origin 2018Pro的PACA软件包对拉曼光谱数据集进行了主成分分析;步骤四:深度学习模型建模,通过制备的拉曼光谱数据集在TensorFlow2.0框架下通过不同的维度输入建立了两种深度学习模型,分别为R

S

1D模型和R

S

2D模型,验证了通过深度学习建立模型可以有效的对不同地区大米进行检测分类;步骤五:模型训练与评价,在对拉曼光谱数据进行了预处理之后,选择数据集中80%的数据作为训练集,20%的数据作为测试集;在训练过程中仅使用训练集来训练模型,而不使用独立的测试集进行训练;对于分类模型,混淆矩阵和ROC曲线以及ROC曲线下的AUC值常被作为模型的评估指标。2.根据权利要求1所述的一种基于深度学习的拉曼光谱大米检测方法,其特征在于:所述步骤二中,在测量拉曼光谱的过程中每个样品重复扫描三次,检测时统一将镜头对准大米中心部位,以消除样品不均匀性带来的干扰。3.根据权利要求1所述的一种基于深度学习的拉曼光谱大米检测方法,其特征在于:所述步骤三中,airPLS算法以惩罚最小二乘法为基础,在迭代过程中,通过自适应调整拟合基线与原始信号之间残差平方和的权重,高效精准找到并扣除不规则变化的基线;在该算法中,z为长度为l的拟合信号,x为真实信号,拟合信号和真实信号的关系可用如下表述:中,z为长度为l的拟合信号,x为真实信号,拟合信号和真实信号的关系可用如下表述:中,z为长度为l的拟合信号,x为真实信号,拟合信号和真实信号的关系可用如下表述:式中,F为信号的拟合精确度,R为拟合信号z的粗糙度,Q为精确度与粗糙度之间的平衡;通过求取时的解,即可得到平滑后...

【专利技术属性】
技术研发人员:申禹杨兴华强成文
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1