基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法技术

技术编号：21180747 阅读：31 留言：0更新日期：2019-05-22 13:25

本发明专利技术提供了一种基于PCA‑Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法。本发明专利技术针对拉曼峰相似的两种食源性致病菌——大肠杆菌0157:H7以及布鲁氏菌S2株识别精度不足的问题，提出一种基于PCA‑Stacking的拉曼集成分类算法，找到了鲁棒性更好的数学统计模型和计算方法。针对拉曼光谱中存在的毛刺，基线漂移问题，使用Savitzky‑Golay滤波器和非对称最小二乘实现光谱的预处理。通过网格搜索模型参数，证明了Stacking集成算法相比于K近邻、逻辑回归、支持向量机单一算法模型有更高的分类准确率。

Training Method of Raman Spectrum Recognition Model for Food-borne Pathogens Based on PCA-Stacking

The invention provides a training method for Raman spectrum recognition model of foodborne pathogenic bacteria based on PCA Stacking. The Raman integrated classification algorithm based on PCA Stacking is proposed to solve the problem that the recognition accuracy of two food-borne pathogenic bacteria with similar Raman peaks, Escherichia coli 0157:H7 and Brucella S2 strains, is insufficient, and a mathematical statistical model and calculation method with better robustness are found. To solve the problems of burrs and baseline drift in Raman spectra, Savitzky Golay filter and asymmetric least squares are used to realize spectral preprocessing. The parameters of grid search model prove that Stacking ensemble algorithm has higher classification accuracy than K-nearest neighbor, logistic regression and single algorithm model of support vector machine.

全部详细技术资料下载

【技术实现步骤摘要】
基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法
本专利技术涉及一种基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法。
技术介绍
目前，用于检测食源性致病菌的方法有：形态学鉴定、免疫学检测及聚合酶链式反应等。但是，这些方法操作步骤复杂，周期长，不能有效地起到监测、预防作用。拉曼光谱是基于光和材料内化学键的相互作用而产生的，通过对食源性致病菌拉曼光谱信号的分析，可快速实现对致病菌的辨识。由于原始拉曼光谱存在许多噪声，并且不同物质可能在相同波长处有类似的峰形，这些因素降低了目前人工识峰的准确度，导致食源性致病菌的错误判别。
技术实现思路
本专利技术的目的在于提供一种基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法。为解决上述问题，本专利技术提供一种基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法，包括：对原始大肠杆菌O157：H7、布鲁氏菌S2株的拉曼光谱进行归一化处理，对所述拉曼光谱去噪并扣除荧光背景；对去噪并扣除荧光背景后的拉曼光谱提取主成分；对提取主成分后的数据集进行X∶Y比例的划分，其中，X+Y＝100，X％作为测试集，Y％作为训练集；基于所述训练集训练多个基础层次模型，基于每个基础层次模型的输出训练各个对应的元模型，将各个元模型聚合为Stacking模型；采所述测试集验证所述Stacking模型的准确率。进一步的，在上述方法中，使用Savitzky-Golay滤波器和非对称最小二乘对所述拉曼光谱去噪。进一步的，在上述方法中，对去噪并扣除荧光背景后的拉曼光谱提取...

【技术保护点】
1.一种基于PCA‑Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法，其特征在于，包括：对原始大肠杆菌O157：H7、布鲁氏菌S2株的拉曼光谱进行归一化处理，对所述拉曼光谱去噪并扣除荧光背景；对去噪并扣除荧光背景后的拉曼光谱提取主成分；对提取主成分后的数据集进行X：Y比例的划分，其中，x+Y＝100，X％作为测试集，Y％作为训练集；基于所述训练集训练多个基础层次模型，基于每个基础层次模型的输出训练各个对应的元模型，将各个元模型聚合为Stacking模型；采所述测试集验证所述Stacking模型的准确率。

【技术特征摘要】
1.一种基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法，其特征在于，包括：对原始大肠杆菌O157：H7、布鲁氏菌S2株的拉曼光谱进行归一化处理，对所述拉曼光谱去噪并扣除荧光背景；对去噪并扣除荧光背景后的拉曼光谱提取主成分；对提取主成分后的数据集进行X：Y比例的划分，其中，x+Y＝100，X％作为测试集，Y％作为训练集；基于所述训练集训练多个基础层次模型，基于每个基础层次模型的输出训练各个对应的元模型，将各个元模型聚合为Stacking模型；采所述测试集验证所述Stacking模型的准确率。2.如权利要求1所述的基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法，其特征在于，使用Savitzky-Golay滤波器和非对称最小二乘对所述拉曼光谱去噪。3.如权利要求1所述的基于PCA-Stacking建立的食源性...

【专利技术属性】
技术研发人员：史如晋，夏钒曾，夏志平，曾万聃，曲晗，李乾学，杨瑞君，
申请(专利权)人：上海应用技术大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人